디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] AI 학습 데이터 시장 급속 확대..."단어에 1000개 당 1달러"

ㅇㅇ(182.230) 2024.04.07 21:21:28
조회 2108 추천 17 댓글 5
														
https://www.aitimes.com/news/articleView.html?idxno=158618

 



7ce88870b48a07f739ef80e247ee726f3d3fa8f2aa813f84837ca2cc26cac71a1b



인공지능(AI) 학습 데이터를 둘러싼 저작권 문제가 불거지며, 관련 데이터 시장의 규모가 급성장하고 있다. 텍스트의 경우 1000단어 구입 비용으로 1달러를 내고 있다는 구체적인 사례도 등장했다.

로이터는 5일(현지시간) 최근 AI 기업들이 콘텐츠 소유자들에게 수천만달러 규모의 학습 데이터 거래를 제안하는 등 관련 시장이 급속하게 커지고 있다고 보도했다.

이에 따르면 데이터 확보는 텍스트와 이미지, 동영상으로 전방위 확대되고 있다.

그 예로 2000년대 초반 7000만명의 사용자를 보유했던 세계 최고의 이미지 호스팅 사이트 '포토버킷'을 예로 들었다. 현재는 사용자가 200만명으로 줄어 들었지만, 최근 여러 기술회사가 130억장에 달하는 사진과 비디오의 사용권을 확보하기 위해 접촉 중이다.

테드 레너드 포토버킷 CEO는 사진은 5센트~1달러, 비디오는 1달러 이상의 가격으로 논의 중이며, 구매자와 원하는 이미지 유형에 따라 가격은 매우 다양하다고 말했습니다. "한 회사는 우리가 보유한 비디오보다 더 많은 양을 원한다며, 머리를 긁적이며 '그건 어디서 구하지'라고 말했다"라고 밝혔다.

이 협상에 따르면 포토버킷은 이미 수십억달러 상당의 콘텐츠를 보유한 셈이다.

로펌 클라리스 로의 에드워드 클라리스는 "지금은 스크랩할 수 없는 개인 컬렉션을 보유한 저작권 소유자를 찾는 일이 쇄도하고 있다"라며 이 경우 거래 규모는 수천만달러에 달한다고 밝혔다.

실제로 오픈AI 등이 셔터스톡이나 AP 등과 맺은 규모는 2500만~5000만달러(약 340억~680억원)이며, 규모가 점차 커지는 추세다.

이처럼 기존 콘텐츠에 대한 권리를 확보하는 동시에 영상 및 음성 샘플을 처음부터 생성하기 위해 단기 계약직 근로자 네트워크를 구축하는 전용 AI 데이터 회사 산업도 등장하고 있다.

데이터 라인서스 대행 업체인 시애틀의 디파인드AI는 구글이나 메타, 애플, 아마존, 마이크로소프트와 같은 빅테크와 거래하는 것으로 알려졌다.

대니얼 브라가 디파인드AI CEO는 일반적으로 이미지당 1~2달러, 비디오당 2~4달러, 긴 영화의 경우 시간당 100~300달러를 지불한다고 말했다. 텍스트의 시장 가격은 단어당 0.001달러, 즉 1000단어에 1달러다. 이 회사가 콘텐츠 제공업체들에 받는 수수료는 20~30% 정도다.

가장 비싼 데이터는 기술 회사가 차단할 이미지를 가려내는 AI 시스템 훈련용 데이터라고 밝혔다. 여기에는 폭력과 누드 등이 포함돼 있으며, 이 경우 가격은 몇배 이상 뛴다는 설명이다.

이 때문에 이런 이미지를 확보하기 위해 남미나 아프리카의 경찰이나 프리랜서, 의대생 등으로부터 범죄 현장, 폭력, 수술 이미지를 구하는 경우도 있는 것으로 알려졌다. 즉 개인 정보 유출 등의 문제점도 안고 있다는 분석이다.

특히 일부 AI 모델의 경우 학습 데이터를 그대로 출력하는, 이른바 '역류' 현상을 일으키는 경우도 보고됐다. 이 경우 대이터에 포함된 개인 정보는 그대로 노출된다.

또 최근에는 레딧과 구글의 계:약으로 SNS 데이터 활용에 대한 문제도 도마 위에 올랐다.

미국 연방거래위원회(FTC)는 레딧 사용자들의 동의 없이 SNS 게시물을 데이터 학습에 제공했는지 조사할 것이며, 이런 사례가 개인 정보 보호 및 지적 재산권 규정에 위배될 수 있다고 경고했다.

이처럼 저작권 문제가 강화되고 AI 학습에 필요한 데이터가 늘어나며, 가격 상승은 물론 데이터 고갈로 인한 AI 발전 중단까지 경고되는 실정이다.

이에 따라 일부 전문가들은 데이터 문제로 대형언어모델(LLM) 개발이 일부 거대 기업의 전유물이 될 것이며, 학습 데이터를 늘리는 방식만으로는 인공일반지능(AGI) 도달에 한계를 맞을 수 있다고 경고하고 있다.



자동등록방지

추천 비추천

17

고정닉 8

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
412470 공지 레이 커즈와일 신간 6월 25일 발매 [29] 모브갤로그로 이동합니다. 24.01.24 7186 32
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [2972] 특갤용갤로그로 이동합니다. 23.08.06 38358 43
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 2324 2
363220 공지 선형글 삭제 기준 [6] 특갤용갤로그로 이동합니다. 23.10.14 6979 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 12979 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [50] 특갤용갤로그로 이동합니다. 23.11.07 8704 79
385147 공지 구글의 AGI 분류 체계 [17] ㅇㅇ갤로그로 이동합니다. 23.11.22 8060 31
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 8921 30
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 22435 33
480114 일반 세상에서 제일 기분 좋은것 [1] ㅇㅇ(211.46) 09:00 23 0
480113 일반 어제 발표 어땠음? ㅇㅇ(103.237) 08:58 21 0
480112 일반 챗봇 아레나 이거 뭡니까? [2] ㅇㅇ(59.13) 08:54 57 0
480111 일반 역노화는 어디서 나온 얘기임? 알뜰살뜰(183.109) 08:51 27 0
480110 일반 고래 얘기 하는 거 보니까 고래어 정복할듯 ㅇㅇ ㅇㅇ갤로그로 이동합니다. 08:50 27 0
480109 일반 역노화 되어도 결국 열죽음은 못막네 [1] ㅇㅇ갤로그로 이동합니다. 08:48 50 0
480108 일반 이거 결국 내예측이 맞았구만 ㅇㅇ(117.20) 08:47 114 1
480107 일반 트위터보면 대부분 테슬라 주주?들은 OAI에서 나간 애들이 [1] ㅇㅇ(182.226) 08:45 59 0
480106 일반 클로드 채팅마다 성격이 다른 거 같은데 맞나? [1] ㅇㅇ(122.199) 08:41 25 0
480105 일반 내 예상인데 테슬라랑 MS가 [3] 알뜰살뜰(183.109) 08:30 119 0
480104 일반 지피티 웹으로 구독했는데 모바일은 또 다른거임? [4] ami(59.4) 08:27 99 0
480103 일반 ai 공짜 학습 막는다... 정부, 뉴스 등 저작권료 기준 연내 마련 [4] ㅇㅇ갤로그로 이동합니다. 08:23 186 0
480102 일반 인생은 줄타기인거 알지? 알뜰살뜰(183.109) 08:23 55 0
480101 일반 지구를 지배할 기업은 MS다. 알뜰살뜰(183.109) 08:17 56 0
480100 일반 꿈에서 chat gpt5 0 하는 꿈 꿨음 Trace-aso갤로그로 이동합니다. 08:11 47 0
480099 일반 그냥 궁금한건데 고래보다 큰 해양생물도 있냐? [5] ㅇㅇ(218.152) 08:08 169 0
480098 일반 마소에서 어떤 것들 발표함? ㅇㅇ(218.157) 08:07 58 0
480097 일반 끝났네. 게임오바 ㅇㅇ(14.53) 08:05 251 0
480096 일반 네이버 클로바 한국형 개소리하지말고 eu나 진출해라 [4] 연맛갤로그로 이동합니다. 08:00 115 0
480095 일반 하 씨발 내 그녀가 [3] ㅇㅇ갤로그로 이동합니다. 07:50 220 0
480093 일반 소셜 스코어링은 대체 왜안되는거지 [3] 탈조선갤로그로 이동합니다. 07:39 55 0
480092 일반 Eu는 곧 ai서비스 없는 나라 될 확률 높다 [10] 탈조선갤로그로 이동합니다. 07:27 355 0
480091 일반 이거 원래 있던 기능인가(gpt) [2] ㅇㅇ(110.12) 07:24 270 0
480090 일반 특이점이 2035년에 더 빨리 온다고 들었던 거 같은데 [1] ㅇㅇ(122.202) 07:23 87 0
480089 정보 EU, 세계 첫 포괄적 AI규제법 2026년 전면 시행 확정 [6] 연맛갤로그로 이동합니다. 07:20 214 0
480088 일반 이 갤에 성경 안읽은 사람 너무 많은거 같음 [1] ㅇㅇ(175.192) 07:12 181 0
480087 일반 그렇네? 코딩을 모르는 정부가 어떻게 ai를 통제함? [3] ㅇㅇ(175.192) 07:08 193 0
480086 일반 AI들 씹선비짓 ㅈㄴ 짜증나네 ㅆㅂ [1] ♡D^^갤로그로 이동합니다. 06:59 200 1
480085 일반 빅테크 “AI위험 통제 어려우면, 서비스 중단” [AI 서울정상회의] [4] 연맛갤로그로 이동합니다. 06:47 288 2
480084 정보 GPT-4o 출시하자 '챗GPT' 모바일 앱 수익 급등 [2] 연맛갤로그로 이동합니다. 06:46 272 2
480083 일반 마소가 진짜 외유내강임 탈조선갤로그로 이동합니다. 06:44 130 0
480082 일반 이미 사람들 클라우드 다 azure씀 [8] 탈조선갤로그로 이동합니다. 06:36 273 0
480081 일반 마소 얘네 ㄹㅇ 위험하다 탈조선갤로그로 이동합니다. 06:33 250 0
480080 일반 알트만 전지전능 천재설 [2] ㅇㅇ(117.20) 06:21 262 0
480079 일반 gpt5가 그 정도라면 gpt4o가 그렇게 나올수가있나? [7] ㅇㅇ(125.178) 06:20 246 0
480078 일반 ㅋㅋ 스칼렛 요한슨 진짜 어이가없네 [5] ㅇㅇ(211.179) 06:10 516 14
480077 일반 특붕이들아 우리는 앞으로 수천년을 더 살게 될거다 [11] ㅇㅇ갤로그로 이동합니다. 05:57 316 0
480076 일반 존버899일차 [1] alphaca갤로그로 이동합니다. 05:53 59 0
480075 정보 소신 하나는 대단한 형... [1] ㅇㅇ(119.77) 05:46 245 1
480074 일반 4o 대화창 삭제해도 이전 내용 기억하고 있는거 맞음? [16] ㅇㅇ갤로그로 이동합니다. 05:41 228 1
480073 일반 사람이 바뀌진 않지만. ㅇㅇ(49.1) 05:30 39 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2