디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] Cognition의 Devin으로 알아보는 AI업계의 과대광고

ㅇㅇ(218.53) 2024.04.13 09:21:39
조회 1595 추천 55 댓글 17
														


3줄 선요약

1. 최초의 AI Software Engineer라고 불리던 Devin은 과장 광고된 능력과 달리, 비효율적이고 불완전한 작업 방식으로 실제 소프트웨어 개발 업무에 적용하기 어려움

2. 현 AI 업계는 기술의 한계를 숨기고 과장된 홍보로 대중의 오해와 과도한 기대를 조장하는 경향이 있음

3. AI 기술 발전을 위해서는 투명한 정보 공개와 건강한 비판 문화가 필요하며, AI의 잠재력과 한계를 균형 있게 바라보는 시각이 중요함



3월 중순쯤 Cognition에서 'Devin'이라는 AI기반 소프트웨어 엔지니어링 도구를 발표 했었음. 당시 IT업계에서는 'The World's First Ever AI Software Engineer'라며 대서특필을 했었음. 그러나 본 영상에서는 이것은 모두 빛좋은 개살구 라는것을 Devin은 비효율적인 문제해결능력, 과장광고를 꼬집어 비판하고있음.



1. Devin의 비효율적인 문제해결능력

1) 불필요한 파일 생성 및 디버깅: 영상에서 Devin은 "visualize_detections.py" 파일에서 발생한 오류를 수정하는 모습을 보이고 있음. 그러나 이 파일은 사용자가 제공한 레포지토리에는 존재하지 않는 파일임. 이와 마찬가지로 다른 작업에서도 'update_image_ids.py'파일에서 발생한 오류를 수정하는 모습을 보이고 있음. 이 파일 역시 저장소에 없는 파일이며, Devin이 스스로 생성한 것으로 보임. 즉, Devin은 스스로 생성한 불필요한 파일에서 발생한 오류를 해결하기 위해 복잡한 코드를 생성하며 비효율적인 디버깅 과정을 거침.


2) 비효율적인 코드구조: Devin은 "update_image_ids.py" 파일에서 데이터를 처리하기 위해 버퍼를 사용했음. 버퍼 사용은 과거 C 언어와 같은 저수준 언어에서 주로 사용되던 방식이며, 현대 Python에서는 더 효율적이고 간결한 방법들이 존재함. 심지어 C언어를 통해 버퍼를 사용하고 파이썬으로 바인딩하는 괴랄한 솔루션을 제시함.... 이러한 Devin이 생성한 코드는 불필요하게 복잡하고, 가독성과 유지 보수성이 떨어짐. 


24b0d121e09c28a8699fe8b115ef046b6d6e9033

*예시비교 C언어 vs 파이썬



3) 이상한 명령어 사용법: 영상에서 Devin은 "head -n 5 results.json | tail -n 5" 명령어를 사용하는 장면이 나옴. 이는 "results.json" 파일의 처음 5줄을 가져온 후 다시 그중 마지막 5줄을 가져오는 명령어로, 논리적으로 의미가 없음. "head -5 results.json" 명령어만으로도 동일한 결과를 얻을 수 . 이는 Devin의 코드 생성 과정에서 불필요한 복잡성과 오류가 발생하였고, 명령어구문을 이해하고 사용하는것이 아님을 의미함.


4) 주어진 다양한 자료에 대한 활용 부족: 사용자가 제공한 코드 저장소의 README 파일에는 추론 작업을 수행하기 위한 간단한 명령어가 명시되어 있음. 하지만 Devin은 이를 활용하지 않고, 불필요한 코드 생성과 디버깅 과정을 거침. 이는 Devin이 주변 정보를 효과적으로 활용하지 못함을 보여줌.


5) 오류 패싱: 사용자가 제공한 코드 저장소의 "dataset.py" 파일에는 torch 모듈의 '_six' 속성을 참조하는 오류가 존재함. 하지만 Devin은 이 오류를 발견하거나 수정하지 못함.


6) 과도한 추론시간: 영상의 타임스탬프를 통해 Devin이 작업을 수행하는 데 6시간 이상 소요되었음을 알 수 있음. 간단한 추론 작업을 수행하는 데 이렇게 많은 시간이 소요된 것은 매우 비효율적임. (예를들어 한 문제를 해결하기위해  GPT4 turbo 0409 api를 6시간동안 계속 사용한다고 가정하자... 비용은 끔찍할것)



2. Devin의 과장광고

1) 수익창출 주장:  영상 설명과 홍보 자료에서는 Devin이 Upwork에서 작업을 수행하고 돈을 벌 수 있다고 주장했지만, 실제 영상에서 Devin은 사용자 요구 사항을 충족시키지 못했고, 따라서 실제 수익 창출로 이어지지 않음.


2) "세계 최초의 AI 소프트웨어 엔지니어" 주장: 이 주장은 모호하고 주관적임. 과거에도 코드 생성이나 자동화를 지원하는 AI 도구들이 존재했기 때문에, Devin이 "최초"라고 단정 짓기 어려움



Cognition의 Devin 시연 자료만으로도 그의 능력에 의문을 갖게됨. 이러한 문제는 Cognition에만 국한된 것이 아니라 AI 업계 전반의 문제임. 언론인, 블로거, 인플루언서 등이 사실 확인 없이 정보를 전파할 경우, 소비자들은 AI의 현재 능력에 대해 잘못된 인식을 갖게 될 수 있음. 또한, AI가 생성한 코드의 신뢰성 문제는 더 많은 버그와 보안 취약점을 초래할 수 있음.


물론 위에 Devin과 같은 예시는 AI스타트업이 VC로 부터 투자를 받기위해 온몸비틀기 하는거임(극단적인 예로, 코1인붐때 NFT가 VC투자받으면서 날뛰던거랑 비슷한맥락임). 따라서 소비자가 주체가되어 AI 관련 정보를 비판적으로 수용하는 자세가 필요함을 강조하고있음.






유익했다면 개추줘 응애

자동등록방지

추천 비추천

55

고정닉 13

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
458089 정보/ (AI겨울)주커버그는 AGI가 멀었다고 생각합니다 [26] ㅇㅇ(123.100) 04.20 3974 25
458068 일반 403.. 이게 무슨 숫자인지 아시나요? [9] ㅇㅇ(59.3) 04.20 2781 31
458049 정보/ 이너코스모스, 우울증 치료하는 뇌 임플란트 출시...간단한 수술이 장점 [12] ㅇㅇ(182.230) 04.20 870 23
458019 정보/ 젠슨 황: 머지않은 미래 적절가격에 휴머노이드 보급 가능 [41] noosphere갤로그로 이동합니다. 04.20 3259 26
457991 정보/ 한국이 파운데이션 모델 '0'을 기록한 이유는 [15] ㅇㅇ(182.230) 04.20 2462 25
457974 일반 르쿤햄) 라마3 성능의 비결 [33] ㅇㅇ(121.133) 04.20 2838 28
457963 정보/ 안드레 카파시의 라마3 평가 [11] ㅇㅇ(182.230) 04.20 2264 26
457932 정보/ OpenAI 포럼 강연 - 민주적 인풋 [11] ㅁㄴㅇㄹ갤로그로 이동합니다. 04.20 297 14
457928 일반 agi 은근슬쩍 내려치기 하는 놈들이 보이네 [27] ㅇㅇ(1.237) 04.20 2692 24
457897 일반 AGI가 코앞이 아닌거 같은 이유 [78] ㅇㅇ(1.234) 04.20 4211 35
457875 일반 르쿤게이도 라마3 기여했다 [8] ㅇㅇ(123.100) 04.20 1719 23
457850 일반 정치충은 막는게 맞음 [29] ㅇㅇ(106.101) 04.20 1643 29
457839 일반 르쿤이 메타 LLM팀 아님 [7] ㅇㅇ(125.191) 04.20 1527 20
457752 일반 한 남자의 어록 모음 [37] agi2024갤로그로 이동합니다. 04.19 3157 53
457748 일반 ???: ㅋㅋ 고작 이딴걸로 좋아하네 [13] agi2024갤로그로 이동합니다. 04.19 3149 23
457691 일반 이미 로펌에서 GPT-4 로 변론서 작성중이라는데 ㅋㅋㅋㅋㅋ [13] ㅇㅇ(124.49) 04.19 2723 24
457690 일반 역시 르쿤이형이냐 [12] ㅇㅇ(59.11) 04.19 1980 56
457641 정보/ (오피셜) 라마3 곧 추가될 기능들 [15] ㅇㅇ(123.100) 04.19 2622 27
457620 일반 405B 짜리는 GPT-4 터보 걍 좆바르겠노 ㅋㅋ [8] ㅇㅇ(123.100) 04.19 2137 20
457615 일반 라마3 한국어로 쓰고 실망 ㄴㄴ [4] ㅇㅇ(123.100) 04.19 2237 19
457613 일반 챗봇아레나 라마3 성능 돌아버렸네 ㅋㅋㅋㅋㅋㅋㅋㅋ [6] ㅇㅇ(110.145) 04.19 2189 21
457608 정보/ 라마3 Chatbot arena 리더보드 순위 미쳤노ㅋㅋㅋ [4] ㅇㅇ(123.100) 04.19 1251 19
457522 정보/ MS '대화하는 얼굴' VASA-1 작동 영상 [6] ㅇㅇ갤로그로 이동합니다. 04.19 1203 22
457509 정보/ 오늘 있던 Oai 강연 + 앞로 있을 3개 [12] ㅁㄴㅇㄹ갤로그로 이동합니다. 04.19 1853 23
457496 일반 라마3 400b 성능은 gpt-4보다 훨씬 높을수도 [14] ㅇㅇ(110.145) 04.19 1668 19
457492 정보/ 학계 "딥러닝이 벽에 부딪히고 있습니다" [28] 특술람갤로그로 이동합니다. 04.19 855 13
457481 정보/ chagpt가 특정 단어를 반복하는 이유에 대한 기사가 나왔네 [17] ㅇㅇ갤로그로 이동합니다. 04.19 2305 24
457455 일반 라마3는 충분히 기뻐할만한 일 아님? [15] ㅇㅇ(211.44) 04.19 2358 46
457454 일반 라마 매력봐라 ㅅㅂㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [14] 아디라스갤로그로 이동합니다. 04.19 3404 33
457432 일반 라마3 아이폰에서 구동 성공 [15] rtOS갤로그로 이동합니다. 04.19 2642 23
457416 일반 라마4 떡밥 [3] 특술람갤로그로 이동합니다. 04.19 1046 22
457400 정보/ 스탠포드 피셜)) 분야별 ai발전 속도 인덱스 [19] lightvector갤로그로 이동합니다. 04.19 2590 27
457399 정보/ 메타 실시간 이미지 생성 발표 [9] 특술람갤로그로 이동합니다. 04.19 2735 30
457358 일반 라마3 동양인 혐오하네 ㅇㅇ [19] ㅇㅇ갤로그로 이동합니다. 04.19 3170 33
457357 일반 솔직히 라마 좃도 안기쁘면 개추 ㅋㅋ [20] ㅇㅇ(210.205) 04.19 2814 30
457344 AI창 수노3) 라마가 부른 노래 만들어봄 [8] ㅇㅇ갤로그로 이동합니다. 04.19 1241 17
457310 일반 라마3 70b 사용해볼수있게 허깅쳇에 떳다 [7] ㅇㅇ갤로그로 이동합니다. 04.19 2132 24
457304 정보/ 찬양하라ㅡMeta. [4] ㅇㅇ(123.100) 04.19 1847 28
457303 정보/ 라마3에 사용된 인간 주석데이터양 ㄷㄷㄷ [8] ㅇㅇ(123.100) 04.19 2393 20
457301 정보/ 라마2vs3 발전속도 보기.. [7] ㅇㅇ(123.100) 04.19 1971 21
457300 일반 Meta는 오픈소스 AGI를 위한 데이터센터 구축 중 [12] 모브갤로그로 이동합니다. 04.19 1379 23
457272 정보/ 오피셜) GPT4 API 사망 [6] ㅇㅇ(123.100) 04.19 3203 32
457260 일반 라마3 400b와 4터보 벤치 [8] ㅇㅇ(175.124) 04.19 1605 16
457254 일반 개념글 빨리 올려라 시발 ㅋㅋ [10] lightvector갤로그로 이동합니다. 04.19 1859 29
457232 일반 GPT4 초 멸망ㅋㅋㅋㅋ [2] ㅇㅇ(123.100) 04.19 2610 22
457213 정보/ 라마3 벤치마크 [16] ㅇㅇ(211.59) 04.19 2002 22
457172 일반 라마3 70b [5] 특술람갤로그로 이동합니다. 04.18 1757 28
457168 일반 르쿤햄 오늘도 호감 1스택 적립 [5] ㅇㅇ(218.158) 04.18 1369 27
457165 정보/ 라마3 발표 [15] 특술람갤로그로 이동합니다. 04.18 2719 34
457122 일반 국내는 솔직히 병신맞음 [4] ㅇㅇ(118.235) 04.18 1137 18
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2