표제지 1
목차 2
01. 서론 3
02. 인터넷에 공개된 뉴스는 공짜? 5
03. 저작권의 맹점과 이중적 태도 8
04. AP통신 사례로 본 AI와 언론의 첫 공식 계약 11
05. 악셀 슈프링어와 파이낸셜타임즈의 사례 13
06. AI와 언론사의 제휴 확대: 24년 5월의 사례 15
07. 오픈AI 외 주요 플랫폼의 계약 동향 18
08. 저작권을 둘러싼 소송 격화 20
09. AI 제휴의 편중 현상 23
10. 국내 언론과 AI 플랫폼 간 협상 및 소송 현황 26
11. 국내 언론의 과제는? 29
12. 결론 및 제언 32
[표 1] LLM 개발사와 언론사와의 뉴스 데이터 제휴 현황 19
[표 2] 국내에서 개발된 주요 LLM 27
[그림 1] 뉴스 데이터는 물처럼 공짜로 쓸 수 있을까? 6
[그림 2] LLM 학습의 활성화로 AI 업계에서는 웹에 있는 타인의 데이터를 입수해 마음대로 쓰는 사례가 늘고 있다. 이를 사실상 거리의의 상점을 깨고 들어가 물건을... 7
[그림 3] 생성 AI는 종전의 저작권법을 혼란에 빠뜨리고 있다 10
[그림 4] 오픈AI와의 라이선스 계약을 알리는 AP통신의 기사 화면 12
[그림 5] 악셀 슈프링어와 오픈AI의 제휴 협약 발표문. 이 계약은 처음으로 LLM 업체에 제공하는 데이터가 세분화됐다는 점에서 주목을 받았다 14
[그림 6] 데이터 제공의 대가로 LLM 업체가 언론사가 쓸 수 있는 AI 광고 시스템 등의 개발을 돕는 경우도 나오고 있다 16
[그림 7] '역류'의 예시. 챗GPT가 출력한 NYT의 '뉴욕시 택시 영업권 탐사보도' 기사를 원본 기사와 대조한 결괏값. 몇몇 문장과 단어를 제외한 대부분 대목이 동일하다 21
[그림 8] LLM 개발사들은 제휴 검토에 있어서 모든 언론사를 동등하게 대하지 않는 것으로 판단된다 25
[그림 9] LLM 학습에 쓰이는 개별 데이터의 기여도와 값어치를 객관적으로 측정하지 못한다는 현실은 데이터 제휴에 큰 걸림돌이 되고 있다 30
[그림 10] 언론계 일각에서는 LLM 서비스가 언론을 대체할 수 있는 만큼, LLM용 데이터를 제공하는 행위 자체가 전략적으로 옳지 않다는 지적도 나온다 31