디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보글] LongEmbed: 긴 컨텍스트 검색을 위한 임베딩 모델 확장

ㅇㅇ(125.191) 2024.04.20 22:51:51
조회 46 추천 1 댓글 0
														

임베딩 모델은 IR 및 RAG와 같은 최신 NLP 애플리케이션에서 중추적인 역할을 합니다. LLM의 컨텍스트 제한이 100만 개 토큰을 넘어섰지만 임베딩 모델은 여전히 ​​8,000개 토큰을 초과하지 않는 좁은 컨텍스트 창으로 제한되어 법적 계약과 같은 긴 입력이 필요한 애플리케이션 시나리오를 자제합니다. 이 문서에서는 기존 임베딩 모델의 컨텍스트 창 확장을 탐색하여 추가 교육 없이도 한계를 32k로 확장합니다. 먼저, 새로 구축된 LongEmbed 벤치마크에서 긴 컨텍스트 검색을 위한 현재 임베딩 모델의 성능을 검사합니다. LongEmbed는 2개의 합성 작업과 신중하게 선택된 4개의 실제 작업으로 구성되어 있으며, 다양한 길이의 문서와 분산된 대상 정보를 특징으로 합니다. 벤치마킹 결과는 이러한 모델의 개선 여지가 크다는 것을 강조합니다. 이를 기반으로 한 포괄적인 실험에서는 위치 보간과 같은 훈련이 필요 없는 컨텍스트 창 확장 전략이 원래 컨텍스트가 512 또는 4k 이상인지에 관계없이 기존 임베딩 모델의 컨텍스트 창을 여러 배로 효과적으로 확장할 수 있음을 보여줍니다. 또한 APE(절대 위치 인코딩)를 사용하는 모델의 경우 짧은 입력에 대한 원래 동작을 엄격하게 유지하면서 주목할만한 성능 향상을 얻기 위해 추가 미세 조정 가능성을 보여줍니다. RoPE(회전 위치 임베딩)를 사용하는 모델의 경우 NTK 및 SelfExtend와 같은 RoPE 관련 방법을 사용할 때 상당한 향상이 관찰되었으며 이는 컨텍스트 창 확장에 있어 APE보다 RoPE가 우수함을 나타냅니다. 향후 연구를 촉진하기 위해 우리는 LongEmbed 벤치마크와 함께 E5-Base-4k 및 E5-RoPE-Base를 출시합니다.



2caed420abc236a14e81d2b628f17669268c6b36




추천 비추천

1

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
16588 일반 민주주의 한짤 요약 ㅇㅅㅇ [2] 선갤러(122.36) 05.12 112 0
16587 일반 이번 주 테마송 선갤러(125.191) 05.12 66 0
16586 일반 그냥 보이스 AI일 가능성도 높네 선갤러(194.180) 05.12 125 2
16584 일반 OpenAI의 흥분에 기대됨 [7] ㅇㅇ(125.191) 05.12 148 1
16583 일반 Gpt 전화통화 가능한가봄 특술람갤로그로 이동합니다. 05.12 77 0
16582 정보글 로건 킬패트릭 "baby agi 에이전트로 가득 찰 것" [1] ㅇㅇ(125.191) 05.12 111 0
16581 일반 선형은 사실 손해볼게 없음 [1] ㅇㅇ갤로그로 이동합니다. 05.12 172 11
16580 일반 완전 자동화된 진화. Fully Automated Evolution [2] NEMO갤로그로 이동합니다. 05.11 126 0
16579 정보글 Gemini 0514 [2] 특술람갤로그로 이동합니다. 05.11 106 1
16578 정보글 샘알트만이 매우 좋다함 [1] ㅇㅇ(125.191) 05.11 150 1
16577 일반 샘알트만 [1] 특술람갤로그로 이동합니다. 05.11 114 0
16576 일반 에휴 여기는 여전하네 ㅋㅋㅋ ㅇㅇ(211.59) 05.11 138 3
16575 일반 GPT-5는 없을 수도 특술람갤로그로 이동합니다. 05.11 101 1
16574 일반 특이점 이전에 약팔이들이 해먹던거 텔로미어 선갤러(143.244) 05.11 125 6
16573 일반 지미애플 월요일 내용 특술람갤로그로 이동합니다. 05.11 102 1
16572 일반 우주전파재난 위기경보 '주의' 발령…"태양활동으로 자기장 교란" [6] 특술람갤로그로 이동합니다. 05.11 142 0
16571 일반 특붕 파티타임 준비 [6] 특술람갤로그로 이동합니다. 05.11 169 0
16570 일반 특갤 애들 안타깝다 ㅇㅇ(118.235) 05.11 118 9
16569 정보글 로건 킬패트릭 "ai환경은 6개월 뒤 완전히 달라" [3] 특술람갤로그로 이동합니다. 05.11 148 2
16568 정보글 샘알트만 "지능은 물질의 창발 발견" [6] 특술람갤로그로 이동합니다. 05.11 140 2
16567 일반 제발오셈. [3] ㅇㅇ갤로그로 이동합니다. 05.11 100 1
16566 일반 그만 포기하고 일자리나 알아봐라. [3] 병신®갤로그로 이동합니다. 05.11 348 16
16565 일반 B200아직 생산안함?? ㅇㅇ갤로그로 이동합니다. 05.11 49 0
16564 정보글 OpenAI 오디오 추가 새로운 모델 특술람갤로그로 이동합니다. 05.11 82 1
16563 일반 월요일에 발표하는거 GPT-5보다 Cooler하다함 [7] 특술람갤로그로 이동합니다. 05.11 201 5
16562 일반 OpenAI는 주크박스2 공개하셈 [7] 특술람갤로그로 이동합니다. 05.11 94 1
16561 정보글 구글 i/o imagen3 특술람갤로그로 이동합니다. 05.11 57 0
16560 일반 대량실업 언제생김 [4] ㅇㅇ갤로그로 이동합니다. 05.11 98 0
16559 일반 ↓↓ 아랫글 추하게 댓삭중 ㅇㅇ(223.38) 05.11 78 2
16558 일반 Gpt5가 어서 나오셈 ㅇㅇ갤로그로 이동합니다. 05.11 68 1
16557 일반 개인행성갖고시퍼 [5] (61.105) 05.10 146 1
16556 일반 美서 오미크론 변종 확산 [1] 특술람갤로그로 이동합니다. 05.10 114 0
16555 일반 블랙록 ceo가 인구감축 주장하면서 pc주의자인게 우연같나여 ㅇㅅㅇ 선갤러(122.36) 05.10 96 2
16554 일반 블랙록 회장 실체 [2] ㅇㅇ(1.241) 05.10 120 0
16553 일반 구글io에서 재미니1.5안나오는듯 [1] ㅇㅇ갤로그로 이동합니다. 05.10 87 0
16552 일반 agi 오는 시기 현실적 에상 ㅇㅅㅇ [1] 선갤러(122.36) 05.10 115 0
16551 일반 블랙록 ceo 말은 새겨듣는게 조아여 ㅇㅅㅇ 선갤러(122.36) 05.10 101 3
16550 일반 큰거하나 언제옴 [1] ㅇㅇ갤로그로 이동합니다. 05.10 67 1
16549 일반 2024~2025 오픈AI 관련 예측 [10] 선갤러(193.160) 05.10 243 7
16548 일반 온다 온다 아무리 외쳐봐라 [2] 인안나갤로그로 이동합니다. 05.10 101 8
16547 정보글 OAI: 오픈소스는 개뿔, GPU 암호화, 메타는 뒤져라 [1] 선갤러(193.160) 05.10 189 3
16546 일반 특슬람들 스케일 때려박으면 곱셈 된다는 놈들도 있던데 ㅋㅋ [1] 선갤러(193.160) 05.10 109 9
16545 일반 2029도 개씹소린게 [2] ㅇㅇ(1.221) 05.10 102 2
16544 일반 이제 그만 놔주자.. [6] ㅇㅇ(223.38) 05.10 143 6
16543 일반 also인지 뭐 나왔다고 잠시 그갤 흥한다 말나오더만 [1] ㅇㅇ(223.38) 05.10 92 1
16542 일반 내 생각에 agi는 이미 만들어졌어 ㅇㅇ ㅇㅇ(220.116) 05.10 71 1
16541 일반 OpenAI가 이겨야 됨 [2] 특술람갤로그로 이동합니다. 05.10 102 0
16540 일반 블랙록 ceo: 인구가 줄어드는 국가가 승리할 것 [2] shuwa갤로그로 이동합니다. 05.10 121 1
16539 일반 민주주의는 부르즈아의 의도된 망상 ㅇㅅㅇ [2] 선갤러(122.36) 05.10 68 1
16538 일반 지능 만드는법.txt [4] NEMO갤로그로 이동합니다. 05.10 82 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2