디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 오픈AI, 기업용 API 기능 업그레이드..."라마 3에 반격"

ㅇㅇ(182.230) 2024.04.24 22:08:32
조회 444 추천 4 댓글 5
														

https://www.aitimes.com/news/articleView.html?idxno=159062

 



7ce88976b38007f739ee84e243ee7169c5668dc89c76d060c89ecbccbce3e442c0



오픈AI가 기업 사용자를 위한 다양한 새로운 기능을 선보였다. 최근 공개된 메타 ‘라마 3’의 상승세를 꺾기 위한 조치로 해석된다. 오픈AI로서는 'GPT-5' 출시 이전까지 'GPT-4'의 성능을 최고로 유지할 필요가 생긴 셈이다.


벤처비트는 23일(현지시간) 오픈AI가 보안 강화, 관리 제어, 어시스턴트 API(Assistants API) 개선, 비용 관리 도구 등 기업 사용자를 위한 다양한 새로운 기능을 발표했다고 보도했다.


올리비에 고디먼트 오픈AI API 제품 책임자는 “새로운 기능이 API 기반 제품을 통해 프로젝트를 신속하게 확장하기를 원하는 모든 개발자에게 유용할 것”이라고 말했다.


또 메타의 라마 3를 겨냥해 “우리는 항상 더 많은 경쟁을 환영한다. 그것이 모두가 더 나아지는 방법"이고 덧붙였다.


오픈AI는 보안 측면에서 기업이 오픈AI와 마이크로소프트(MS)의 애저 클라우드 간에 직접 비공개 링크를 설정, 공용 인터넷에 대한 노출을 최소화할 수 있게 해주는 '프라이빗링크(PrivateLink)'라는 새로운 기능을 발표했다. 이는 MS 애저 오픈AI 서비스를 사용해 GPT-4와 같은 오픈AI 모델을 미세조정, 클라우드에서 기업에게 안전한 링크를 제공한다.


더불어 강력한 액세스 제어가 필요한 사용자를 위해 기본 다단계 인증 기능을 제공한다. 이 기능은 역할 기반 액세스 제어, SSO(Single Sign-On), AES-256을 통한 저장 데이터 암호화, TLS 1.2를 사용한 전송 중 데이터 암호화 및 SOC Type II 인증과 같은 기존 엔터프라이즈급 보안 기능 스택에 추가된다.


관리 제어 측면에서는 개별 오픈AI 프로젝트에 대해 세부적인 제어와 감독 기능을 제공하는 새로운 프로젝트 기능을 추가했다. 사용자는 API 키와 역할을 특정 프로젝트로 범위를 지정하고, 다양한 오픈AI 모델에 대한 제한 및 허용 목록을 생성하고, 액세스에 대한 사용량 및 속도 제한을 설정해 과도한 요금이 부과되는 것을 방지할 수 있다.



7ce88976b38007f739ee84e24fee7565682f7dceb63b4f98a753f41461654b7b65e60d



어시스턴트 API는 기업 가용자가 대화 어시스턴트를 지원하는 맞춤화되고 미세조정된 모델을 빠르고 쉽게 배포할 수 있도록 도와준다. 이를 통해 모델은 검색 증강 생성(RAG) 기술을 사용해 특정 문서를 호출, 내부 데이터로 AI 어시스턴트의 지식을 향상하려는 기업에 유용하다.


오픈AI에 따르면 이제 어시스턴트 API는 어시스턴트당 1만개의 파일을 처리하는 새로운 ‘파일_서치(file_search)’ 기능을 통해 발전된 파일 검색 기능을 지원한다. 이는 20개의 파일로 제한되었던 이전 어시스턴트 API에 비해 50배 향상한 것이다. 또 병렬 쿼리, 향상된 순위 재지정 및 쿼리 재작성을 포함한 새로운 검색 기능도 추가된다.


어시스턴트 API의 두번째 기능은 실시간 대화 응답을 위한 스트리밍을 추가하는 것이다. 이를 통해 'GPT-4 터보' 및 'GPT-3.5 터보'는 사용자에게 답변을 시작하기 전에 전체 응답 생성을 기다릴 필요없이 토큰이 생성되는 대로 빠르게 출력을 반환할 수 있다.


마지막으로 어시스턴트 API에는 파일 관리를 지원하는 새로운 ‘벡터_스토어(vector_store)’ 객체가 추가됐으며, 토큰 사용을 세밀하게 제어해 사용자 비용을 절감할 수 있다.



7ce88976b38007f739ee84ed46ee7564b4fc138447d5618ed541fff6aa71257d3da9ef



이 외에도 기업이 예산을 초과하지 않고 AI 사용을 확장할 수 있도록 돕는 두가지 추가 비용 관리 기능도 추가했다. 


여기에는 약정 처리량에 대한 사용량 할인이 포함된다. GPT-4 또는 GPT-4 터보를 사용하는 고객이 분당 일정 수준의 토큰을 사용할 경우, 공급된 처리량에 액세스를 요청하고 약정 규모에 따라 10%에서 50%까지 할인받을 수 있다.


긴급하지 않은 워크플로를 비동기식으로 실행할 수 있는 새로운 ‘배치 API(Batch API)’도 있다. 배치 API 요청은 공유 가격보다 50% 저렴하며, 더 높은 속도 제한도 이용할 수 있다. 오픈AI에 따르면 이는 모델 평가, 오프라인 분류, 요약 및 합성 데이터 생성 워크로드와 같은 작업에 이상적이다.


긴급하지 않은 작업을 비동기적으로실행할 수 있는 새로운 ‘배치 API(Batch API)’ 도 있다.  배치 API 요청은 공유 가격의 50% 할인이 적용되며, 훨씬 더 높은 요청 한도를 제공하며, 24시간 이내에 결과를 반환한다. 이는 모델 평가, 오프라인 분류, 요약 및 합성 데이터 생성과 같은 작업에 효과적이다.


이번 업데이트는 라마 3나 '미스트랄'과 같은 오픈 소스 모델의 인기 증가에 대응하기 위해 설계됐다.


이를 통해 오픈AI는 기업에 더 간편한 ‘플러그 앤 플레이’ 경험을 제공할 수 있다. 반면, 라마 3나 미스트랄과 같은 개방형 모델은 기업 입장에서는 더 많은 설정이 필요할 수 있다는 분석이다.


자동등록방지

추천 비추천

4

고정닉 2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
470960 일반 지피티 이년한테 본인 야추사진 보여주고 [1] ㅇㅇ(211.235) 05.14 95 0
470959 일반 수식 사진찍어서 변환하는데 써먹을수있겠다 ㅇㅇ갤로그로 이동합니다. 05.14 61 0
470958 일반 이제 밈도 진짜 딱딱 이해하네 ㅋㅋ [2] TS망상갤로그로 이동합니다. 05.14 216 2
470957 일반 아직도 안떴으면 개추 ㅇㅇ(39.113) 05.14 28 0
470956 일반 근데 이거 왜 80개로 늘어난거임? [2] ㅇㅇ(175.208) 05.14 123 0
470955 일반 4o also이긴한데 압축률 좆되는 모델같다 ㅇㅇ;; [2] ㅇㅇ(218.153) 05.14 235 0
470954 일반 저 수준의 음성인식이 경제에 어느정도 영향 미칠지 궁금함 [2] ㅇㅇ갤로그로 이동합니다. 05.14 109 0
470953 일반 아직 3.5쓰고있는 흙붕이면 개추ㅋㅋ [2] ㅇㅇ(182.219) 05.14 130 3
470952 일반 훨씬 빠르게 느껴지는 4o 빙냥이ㄱㅇㅇ갤로그로 이동합니다. 05.14 62 0
470951 일반 시발 영상처럼 바로바로 대답도 안해주고 [2] ㅇㅇ(211.235) 05.14 125 0
470950 일반 이미지 분석이좆되는데이거 [1] ㅇㅇ(14.35) 05.14 148 0
470949 일반 그래서 언제 ai 랑 같이 겜할수 있슴? ㅇㅇ(175.192) 05.14 28 0
470948 일반 아직 데모에서 보여준 대화기능은 안되네??? [5] rtOS갤로그로 이동합니다. 05.14 173 0
470947 일반 gpt4o가 수학은제일잘하네 [1] ㅇㅇ(221.168) 05.14 164 0
470946 일반 음성대화 진짜 인간과 하는것처럼 된것만으로도 업글이지 ㅇㅇ(182.219) 05.14 39 0
470945 일반 여기 들어가면 공홈 데모영상들 볼수있다 ㅇㅇ(211.192) 05.14 41 0
470944 일반 특들갑 ㅇㅇ(118.235) 05.14 45 0
470943 일반 슬슬 식으면 개추ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [3] 수퍼고수(110.10) 05.14 321 10
470942 일반 ㅈㄴ 빠르긴한데 비디오 음성 실시간 안되는데? [4] ㅇㅇ(121.137) 05.14 171 0
470940 일반 성능이 제일 좋은건 아닌거 같음 역량은 오푸스보다 못해 [6] ㅇㅇ(112.161) 05.14 186 0
470938 일반 이제 GPT 끼리 실시간 음성대화 가능 [1] ㅇㅇ(211.192) 05.14 148 0
470937 일반 근데 이제 뭐함? ㅇㅇ(182.219) 05.14 37 0
470936 일반 한국어는 아직 클로드가 좆바르지? [3] ㅇㅇ(1.229) 05.14 197 0
470935 일반 무료충 다죽이고 제한 200개 해줘야함 [2] ㅇㅇ(211.46) 05.14 109 1
470934 일반 본인 방금 구독하자마자 떴다 ㅋㅋㅋ [1] oo(211.255) 05.14 182 0
470933 일반 gpt4o로 하고싶은거: 도서관책 전부 사진찍어서 맥이기 [4] ㅇㅇ갤로그로 이동합니다. 05.14 163 2
470932 일반 이제 슬슬... ㅇㅇ(58.29) 05.14 47 0
470930 정보/ gpt4o 벤치마크보면 [1] ㅇㅇ(221.168) 05.14 196 1
470929 일반 10분안에 나도 gpt4o 안주면 구독해지함 ㅅㄱ ㅇㅇ(121.162) 05.14 50 0
470928 일반 ㅅㅂ 나도 풀렸다 ㅇㅇ(218.154) 05.14 34 0
470926 일반 자러감 ㅇㅇ(39.124) 05.14 48 0
470925 일반 야 근데 이미지 이해쪽은 그냥4보다 더 잘하는것같다 언어모델갤로그로 이동합니다. 05.14 44 0
470924 일반 아니 근데 라마 400b 왜 gpt4 못이김? [3] ㅇㅇ갤로그로 이동합니다. 05.14 141 0
470923 일반 성능도 성능인데 무료인게 지리네 [3] ㅇㅇ(125.183) 05.14 196 0
470922 일반 와 떳다!! 사진술갤로그로 이동합니다. 05.14 70 0
470921 일반 진짜 망한거 같은데? ㅇㅇ(112.161) 05.14 121 0
470920 일반 4o 체감상 also보다 좆구리고 claude 보다 속도빼고는 그닥.. ㅇㅇ(218.153) 05.14 171 1
470919 일반 스마트폰때도 이랬다고??ㅋㅋㅋㅋㅋㅋ [4] 수퍼고수(110.10) 05.14 230 1
470918 일반 노동해방과 역노화까지 얼마쯤남은거같음? ㅇㅇ(112.164) 05.14 54 0
470917 일반 드디어 gpt 4 o 뜸 아오ㅋㅋ 엘6는agi이후에나오나갤로그로 이동합니다. 05.14 72 0
470916 일반 갑자기 분위기 좆된 거 같으면 개추 ㅇㅇ(125.137) 05.14 87 1
470915 일반 GPT 4o 씹떡짤 분석 TS망상갤로그로 이동합니다. 05.14 168 0
470914 일반 오 나도 떳다 ㅎㅎㅎ ㅇㅇ(123.109) 05.14 55 0
470913 일반 아 나도 GPT-4o 풀렸다 [8] rtOS갤로그로 이동합니다. 05.14 299 0
470912 일반 이건 절대 also 일 수가 없음 [4] ㅇㅇ(125.137) 05.14 231 0
470909 일반 4o 뭐 배정? 같은 걸 받는 게 원래임? ㅇㅇ(118.39) 05.14 47 0
470908 일반 이쯤돼서 해보는 극락 or 나락 투표 ㅇㅇ(218.237) 05.14 48 0
470907 일반 아니 이러면 연애 더 안하고 애 더 안낳겠는데? [3] ㅇㅇ(182.219) 05.14 111 0
470906 일반 나한텐 OCR 번역 기능이 최고였다. [1] 토마스골드갤로그로 이동합니다. 05.14 96 0
470905 일반 근데 알트먼은 걍 경영인임? ㅇㅇ(119.64) 05.14 38 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2