디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 외국 트위터리안의 google io 2024 소감앱에서 작성

빙냥이ㄱㅇㅇ갤로그로 이동합니다. 2024.05.15 16:56:28
조회 314 추천 0 댓글 5
														

A brief summary of the Google i/o 2024, and an explanation of why it made me angry and why I think it has been a huge disappointment. It was no coincidence that OpenAI chose to make a 30-minute announcement about GPT4-o the day before. It was a clear challenge to Google, an exposure. I am not an OpenAI simp under any circumstances. However, I do believe that they are currently the very best in AI research and development. And yesterday's presentation fits in with that. 30 minutes. That's how much time they took to present the GPT-4o's new audio function live (!) on stage. And I am firmly convinced that it really was live. Because numerous errors occurred, and sometimes the voice broke away. Everything seemed quite "beta", but it didn't detract from the presentation. We understood what the future holds. You understood where the journey is going, and it was a clear look into the very near future. 30 minutes after OpenAI's event, many users, including myself, already had access to GPT-4-o (NO "later this year"). Not the new language function, but the much better GPT-4o (whereby it was said that all other functions would come in a few weeks). However, the numerous other functionalities were quite unpretentious. They were presented in passing on the homepage (!). Not a word was said about the fact that GPT-4-o now accommodates image generation in the model itself. Not a word about the fact that 3D animations can be created. It was not worth mentioning and shows impressively what is important to OpenAI. 30 minutes for "Her", and a blog post for all the rest. That's modesty. And now one day later, in complete contrast, Google i/o 2024. Not a word about modesty. While OpenAI was not ashamed to show the mistakes of "Her", the fact that Gemini 1.5 Pro would now have a context length of 2 million was certainly heard 20 times. When? Sometime later this year. A voice assistant similar to that of OpenAI was also presented. The legendary Demis Hassabis was brought on stage especially for this - as far as I know, the very first time. What did we get to see? Not a live presentation, but a ed video. It is very reminiscent of the previous video, when Gemini-Ultra was credited with the live functionality of Vision, but this turned out to be a simple fraud ("fool me once, shame on you; fool me twice, shame on me"). And here too, you can't get rid of the aftertaste that we are supposed to see something that is nowhere near ready. Anyone who doubts this should seriously ask themselves why there was no live presentation. I promise you: if it was good enough, they would have presented it, if only to avoid the humiliation of OpenAI. What already makes me angry here is that Demis Hassabis, one of the smartest researchers in the world, who made history with AlphaGo, was flown in as an advertising mascot just to give the whole thing a certain authenticity without being able to show anything. Two words about Gemini Flash, which is very cheap but is presented without a benchmark. If no figures are shown, the absence speaks volumes. The failure of Gemma is foreshadowed here. Finally, a short video of "Vio", which honestly looks very pixilated. I'm sorry, but anyone who thinks this is in the same league as Sora is very much mistaken. It's certainly impressive technology, there's no doubt about that. But compared to Sora, it's blurred, washed out and also cut in such a way that you almost only see bright colors and only a short section with real images. If you compare this with the strong videos from Sora, such as the crowds of people, the high-resolution textures and the reflections in the water, it's simply not in the same league. And that was it. That was everything. And that's exactly what I mean. Everything that came after that was Google from 2010. Because let's be honest: starting a developer conference with Google Photos and presenting first that you can now search them with AI says a lot (as a big opener!) The search was improved a little, the workspaces as well, and many functions were advertised that had already existed for a long time. And yes, I still find it embarrassing for a historic company like Google to waste 5 minutes showing how to find a yoga class with AI and Google maps. It's not going to catch on and it's irrelevant. Compared to what AlphaFold 3 delivers, it's trivial and silly. Because THAT is real AI, that is what we need AI for, that is the future! Google i/o is a developer conference and not a marketing event for unnecessary products ("Look at this shiny new Pixel 8a!" Cringe af). At least that's what you'd think if you had any respect for the developers (if you looked into the crowd, they were certainly not enthusiastic). It went on like this with smoothie recipes and dog walkers (all with AI, of course). Unnecessary and will sink into irrelevance, meaningless and impractical. And that is precisely the crux of the matter. Google is under considerable pressure. Google has built up a monopoly since the 1990s and dominates internet search. They have the most compute and the best AI chips (TPU) in the world. They buy the brightest minds (Demis Hassabis and DeepMind) and waste all these resources on such nonsense. They have completely failed to catch up and seize their opportunity. No Gemini Ultra 2, no Gemini Pro 2, no new architecture. No relevant development. Nothing. Instead, products that are worse than the competition or meaningless. On the contrary: they repeatedly emphasized that Gemin 1.5 Pro would have a context length of 1 million. Something that everyone has known for months. They simply had nothing else to counter OpenAI with. Plus silly show interludes that are unworthy of a developer conference. Cringe, as the kids say today. I am sure that Sundar Pichai will not remain CEO for much longer. From what we hear internally, there are very fierce battles between the camps. And currently the AI engineers are being held back by the ethicists. That is clearly evident. Google should have delivered today. They used to be the open source vanguard. They have already given that up to Meta. OpenSource is now called Llama. What remains is masses of compute. And that would have been better given to the competition. I am more hyped for Mistral, Anthropic and whatnot instead of Google. One thing remains particularly memorable. It's not just that they were hardly able to present anything. Everything is also not available. It will come at some point. Later this year (TM). That was the final nail in the coffin. Because months are decades in the age of AI. And Google has a few months, maybe even years, to catch up. A miracle would have to happen.

영어에서 번역(제공)

Google i/o 2024에 대한 간략한 요약과 그것이 왜 나를 화나게 만들었고 왜 큰 실망을 안겨주었다고 생각하는지에 대한 설명입니다. OpenAI가 전날 GPT4-o에 대해 30분 동안 발표하기로 선택한 것은 우연이 아니었습니다. 구글에 대한 노출은 분명한 도전이었다. 나는 어떤 상황에서도 OpenAI 단순한 사람이 아닙니다. 그러나 나는 그들이 현재 AI 연구 개발 분야에서 최고라고 믿습니다. 그리고 어제의 발표도 그 점에 부합합니다. 30 분. 이는 GPT-4o의 새로운 오디오 기능을 무대에서 라이브 (!) 로 발표하는 데 걸린 시간입니다. 그리고 나는 그것이 정말로 라이브라고 굳게 확신했습니다. 수많은 오류가 발생하고 때로는 목소리가 끊어지는 경우도 있기 때문입니다. 모든 것이 "베타"처럼 보였지만 프레젠테이션의 가치를 떨어뜨리지는 않았습니다. 우리는 미래가 어떻게 될지 이해했습니다. 당신은 여행이 어디로 가고 있는지 이해했고, 그것은 아주 가까운 미래에 대한 명확한 시각이었습니다. OpenAI 이벤트가 끝난 지 30분 후에 저를 포함한 많은 사용자가 이미 GPT- 4-o ( NO "올해 말")에 액세스할 수 있었습니다. 새로운 언어 기능은 아니지만 훨씬 더 나은 GPT-4o (다른 모든 기능은 몇 주 안에 제공될 것이라고 합니다). 그러나 그 밖의 수많은 기능은 그다지 소박하지 않았습니다. 홈페이지 (!) 에 전달되면서 제시되었습니다. 이제 GPT- 4-o 모델 자체에서 이미지 생성을 수용한다는 사실에 대해서는 한마디도 언급되지 않았습니다. 3D 애니메이션을 만들 수 있다는 사실에 대해서는 한마디도하지 않습니다. 언급할 가치도 없고 OpenAI에 중요한 것이 무엇인지 인상적으로 보여줍니다. "Her"의 경우 30분, 나머지는 블로그 게시물입니다. 그것은 겸손입니다. 그리고 하루가 지난 지금, 완전히 대조적으로 Google i/o 2024가 열렸습니다. 겸손에 대해서는 한마디도 하지 않습니다. OpenAI는 "Her"의 실수를 부끄러워하지 않았지만 Gemini 1.5 Pro의 컨텍스트 길이가 이제 200만 개라는 사실은 확실히 20번이나 들었습니다. 언제? 올해 말쯤. OpenAI와 유사한 음성 비서도 선보였습니다. 제가 아는 한, 전설적인 데미스 하사비스(Demis Hassabis)가 특히 이 무대에 등장했습니다. 우리는 무엇을 보게 되었나요? 라이브 프레젠테이션이 아니라 대본이 있는 비디오입니다. Gemini-Ultra가 Vision의 라이브 기능으로 인정받았던 이전 비디오를 매우 연상시킵니다. 그러나 이는 단순한 사기로 판명되었습니다("한 번 속이면 부끄러워합니다. 두 번 속이면 부끄러워합니다"). . 그리고 여기서도 아직 준비가 거의 안 된 것을 봐야 한다는 뒷맛을 지울 수 없습니다. 이에 대해 의심하는 사람은 왜 실시간 프레젠테이션이 없었는지 진지하게 자문해 보아야 합니다. 나는 약속합니다: 그것이 충분히 좋았다면 OpenAI의 굴욕을 피하기 위해서만 그것을 제시했을 것입니다. 여기서 이미 나를 화나게 하는 것은 AlphaGo로 역사를 만든 세계에서 가장 똑똑한 연구원 중 한 명인 Demis Hassabis가 아무것도 보여주지 않으면서 전체에 어떤 진정성을 부여하기 위해 광고 마스코트로 날아왔다는 것입니다. 매우 저렴하지만 벤치마크 없이 제시되는 Gemini Flash에 대한 두 단어입니다. 수치가 표시되지 않으면 그 부재가 많은 것을 말해줍니다. 젬마의 실패가 여기서 예고된다. 마지막으로 솔직히 매우 초라해 보이는 "Vio"의 짧은 영상입니다. 미안하지만 이것이 소라와 같은 동질이라고 생각하는 사람은 큰 착각이다. 확실히 인상적인 기술입니다. 의심의 여지가 없습니다. 그러나 Sora와 비교하면 흐릿하고 바래며 잘려서 거의 밝은 색상만 볼 수 있고 실제 이미지는 짧은 부분만 볼 수 있습니다. 군중의 군중, 고해상도 질감, 물에 반사된 장면 등 Sora의 강력한 영상과 비교하면 단순히 같은 리그에 속하지 않습니다. 그게 전부였습니다. 그것이 전부였습니다. 그리고 그것이 바로 내가 의미하는 바입니다. 그 이후의 모든 것은 2010년부터 Google이었습니다. 솔직하게 말해서 Google 포토로 개발자 컨퍼런스를 시작하고 이제 AI로 검색할 수 있다고 먼저 발표하는 것은 많은 것을 말해줍니다(큰 개막식!). 검색이 약간 개선되었습니다. 작업 공간도 그렇고, 이미 오랫동안 존재했던 많은 기능이 광고되었습니다. 그리고 네, 저는 Google과 같은 역사적인 회사가 AI와 Google 지도를 사용하여 요가 수업을 찾는 방법을 보여주기 위해 5분을 낭비하는 것이 여전히 당혹스럽다고 생각합니다. 그것은 따라잡을 수 없으며 관련성이 없습니다. AlphaFold 3이 제공하는 것과 비교하면 사소하고 어리석은 일입니다. 그것이 진짜 AI이기 때문에, 그것이 우리에게 AI가 필요한 이유이고, 그것이 바로 미래입니다! Google i/o는 개발자 컨퍼런스이지 불필요한 제품을 위한 마케팅 이벤트가 아닙니다 (" 이 반짝이는 새 Pixel 8a를 보세요!" Cringe af) 적어도 개발자를 존경한다면 그렇게 생각할 것입니다(만약 군중을 들여다보니 그들은 확실히 열정적이지 않았습니다.) 스무디 조리법과 개 산책기(물론 모두 AI가 포함됨)에서는 이런 식으로 진행되었으며 불필요하고 무의미하며 비실용적이었습니다. 이것이 바로 문제의 핵심입니다. 구글은 상당한 압박을 받고 있다. 구글은 1990년대부터 독점을 구축해 인터넷 검색을 장악했다. 그들은 세계에서 가장 많은 컴퓨팅 성능과 최고의 AI 칩(TPU)을 보유하고 있습니다. 그들은 가장 똑똑한 마음(Demis Hassabis 및 DeepMind)을 구입하고 이러한 말도 안되는 일에 이러한 모든 자원을 낭비합니다. 그들은 기회를 따라잡고 포착하는 데 완전히 실패했습니다. Gemini Ultra 2, Gemini Pro 2, 새로운 아키텍처가 없습니다. 관련 개발이 없습니다. 아무것도 아님. 대신, 경쟁사보다 나쁘거나 의미가 없는 제품. 반대로 그들은 Gemin 1.5 Pro의 컨텍스트 길이가 100만 개일 것이라고 반복해서 강조했습니다. 모두가 몇 달 동안 알고 있던 것입니다. 그들은 OpenAI에 대응할 다른 방법이 없었습니다. 게다가 개발자 컨퍼런스에 어울리지 않는 어리석은 쇼 막간도 있습니다. 오늘 아이들이 말하는 것처럼 움츠러들으세요. 나는 Sundar Pichai가 더 오랫동안 CEO로 남아 있지 않을 것이라고 확신합니다. 내부적으로 들은 바에 따르면 진영간 전투가 매우 치열하다고 합니다. 그리고 현재 AI 엔지니어들은 윤리학자들의 방해를 받고 있습니다. 그것은 분명합니다. Google이 오늘 배송했어야 했습니다. 그들은 오픈 소스 선봉대였습니다. 그들은 이미 그것을 Meta에 넘겨주었습니다. 오픈소스는 이제 Llama라고 불립니다. 남은 것은 엄청난 양의 컴퓨팅입니다. 그리고 그것은 경쟁에 더 잘 주어졌을 것입니다. 나는 Google 대신 Mistral, Anthropic 등을 더 좋아합니다. 특히 기억에 남는 일이 하나 있다. 단지 아무것도 발표할 수 없었던 것만이 아닙니다. 모든 것도 사용할 수 없습니다. 그것은 어느 시점에 올 것입니다. 올해 말(TM). 그것은 관의 마지막 못이었습니다. AI 시대에는 몇 달이 수십 년이기 때문이다. 그리고 Google은 따라잡기까지 몇 달, 어쩌면 몇 년이 걸릴 수도 있습니다. 기적이 일어나야 할 것입니다.



자동등록방지

추천 비추천

0

고정닉 0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3118] 특갤용갤로그로 이동합니다. 23.08.06 39647 43
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [2] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 2638 2
363220 공지 선형글 삭제 기준 [7] 특갤용갤로그로 이동합니다. 23.10.14 7326 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 13489 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [51] 특갤용갤로그로 이동합니다. 23.11.07 9021 79
385147 공지 구글의 AGI 분류 체계 [17] ㅇㅇ갤로그로 이동합니다. 23.11.22 8489 31
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 9236 30
412470 공지 레이 커즈와일 신간 6월 25일 발매 [29] 모브갤로그로 이동합니다. 24.01.24 8129 34
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 22847 33
486101 일반 chatgpt 좋은 점 ㅇㅇ(106.101) 13:26 33 0
486100 일반 우리나라 이주자 받지 말고 그냥 AI로봇 기다렸다가 대체하면 안됨? [7] ramune갤로그로 이동합니다. 13:20 67 0
486099 일반 찌라시 진짜 ㅈ같아지네 [1] 친근한게이브갤로그로 이동합니다. 13:11 151 0
486098 정보/ 문화적 축적을 통한 인간 문화 모델링 [1] ㅇㅇ(221.167) 12:57 59 0
486097 일반 보이스 애플이 독점하면 어떡하냐 [3] 친근한게이브갤로그로 이동합니다. 12:54 99 0
486096 일반 근데 구조적으로 전유물일 수 밖에 없지 않나? [4] ㅇㅇ(211.234) 12:53 81 0
486095 일반 ios18 내 폰도 지원하네 아싸라비야 [2] 특이점이온다갤로그로 이동합니다. 12:53 88 0
486094 일반 Few weeks later? ㅈㄹ한다 증말 [1] 야상섹상갤로그로 이동합니다. 12:52 79 0
486093 일반 그래픽카드 하나 있다고 쓸만한 인공지능 굴릴수 있을까 ? [3] ㅇㅇ갤로그로 이동합니다. 12:50 84 0
486092 일반 우리가 전유물인지 알면 불완전한 전유물 아닌가? [1] ㅇㅇ(141.223) 12:37 71 0
486091 일반 좆까셈 6일날 출시하라고 발표가 아니라 [1] ㅇㅇ(218.146) 12:36 105 0
486090 일반 어차피 10년 후에도 흙수저들은 노가다 뛰어야 하는건 똑같잖아 ㅇㅇ갤로그로 이동합니다. 12:34 60 0
486089 일반 이모든 꿀은 황회장이 다 빨아먹는거지 뭐 ㅋ ㅇㅇ(114.207) 12:33 51 0
486088 일반 식주.충들 좀만 거슬리는 말 하면 숏치라면서 겐세이넣노ㅋㅋㅋ [7] ㅇㅇ(115.139) 12:24 149 9
486086 일반 GTA6 vs GPT5 [3] 개혁신당갤로그로 이동합니다. 12:22 165 0
486085 일반 Gpts는 진짜 초기버전 유튜브 인스타인데 [3] 탈조선갤로그로 이동합니다. 12:21 157 0
486084 일반 GG 지피티5 나오지마라 [1] ㅇㅇ(114.207) 12:21 73 0
486083 정보/ SD3 2b모델 6월 12일 공개 [4] ㅇㅇ(175.208) 12:17 240 7
486082 일반 Gpt5로는 일자리위협 못함 ㅇㅇ(58.29) 12:17 97 1
486081 일반 Gpts가 후지다니 무슨소리노 탈조선갤로그로 이동합니다. 12:17 56 0
486080 정보/ (AGI)인공세대지능: 강화학습을 통한 문화적 축적 [1] 특술람갤로그로 이동합니다. 12:15 93 2
486079 일반 님들 근데 육체노동직업은 안전한거 맞음?? [23] ㅇㅇ(121.142) 12:14 207 0
486078 일반 현재 인공지능 투자 규모와 기업들의 hype, 대중들의 기대심리 [3] ㅇㅇ갤로그로 이동합니다. 12:09 95 0
486077 일반 식비만 생각하면 그 소일렌트인가 그게 안 낫나? ㅇㅇ(121.182) 12:08 42 0
486076 일반 특붕이들 작년에 사무직 따잉거리더만 [9] ㅇㅇ(218.147) 12:05 309 6
486075 일반 음성도 이지랄인데 gpt5 출시는 얼마나 미루겠냐 [5] ㅇㅇ갤로그로 이동합니다. 12:05 162 0
486074 일반 구글 발표면 GPT 업데이트 신뢰성 있지 ㅇㅇ(163.152) 11:50 138 1
486072 일반 구글 뭐 잘못한거 있음? [6] ㅇㅇ(58.29) 11:43 231 0
486071 일반 팩트) ai 기능 ㅈ도 안씀 [3] ㅇㅇ(180.66) 11:43 336 8
486070 일반 잼민이 좀 기대된다 [1] ㅇㅇ갤로그로 이동합니다. 11:41 46 0
486069 일반 Gpt 유료 결제는 언제가 나을까? [1] ㅇㅇ갤로그로 이동합니다. 11:22 107 0
486068 정보/ Gemini 06.05 업데이트 예정 [8] ㅇㅇ(125.191) 11:17 554 5
486067 일반 GPT - 5 내놓으라고 씨발년아 [1] ㅇㅇ(221.167) 11:10 271 1
486066 일반 일레븐랩스 목소리 ㅈㄴ자연스럽노 [1] ㅇㅇ(14.53) 11:08 193 0
486065 일반 이새기 갑자기 정신분열 일으키는데? [5] ㅇㅇ(210.178) 11:04 354 0
486063 일반 Gpt5 여름에 안나올득 ㅇㅇ(58.29) 10:58 80 0
486060 일반 수고했다 업데이트 떳다 [5] 야상섹상갤로그로 이동합니다. 10:50 519 0
486059 일반 LLM 은 이제 보상설계에 대한 도전을 하게 될 것임 [1] ㅇㅇ(221.167) 10:47 110 0
486058 일반 삼성 망했네 [8] (27.35) 10:41 407 3
486057 일반 GPT 안드로이드 업데이트 되었는데 [2] ㅇㅅㄱ(210.100) 10:40 280 0
486056 일반 프리랜서라 행복합니다 [1] ㅇㅇ(125.178) 10:27 137 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2