'chatvector' 태그의 글 목록

[논문요약] Chat Vector: Enhancing LLMs via Simple Model Arithmetic

저자Shih-Cheng Huang 외National Applied Research Laboratories, Taipei, Taiwan한 줄 요약간단한 벡터 연산(덧셈/뺄셈)을 통해 새로운 언어에 대한 instruction following 능력과 human value alignment 능력을 부여하는 방법을 제시풀고자 하는 문제대부분의 오픈 소스 대규모 언어 모델(LLM)은 데이터 제약으로 인해 주로 영어에만 특화비영어권 사용자가 LLM을 처음부터 구축하는 것은 계산 비용이 많이 소요기존의 방법대로 비영어권 LLM을 구축하려면 continual pretraining, SFT, RLHF 등의 복잡한 과정을 거쳐야 함특히 RLHF는 구현이 복잡하고 많은 컴퓨팅 자원을 요구하며, 안정성 문제도 있음인간 선호도..

format_list_bulleted 카테고리 없음
· 2025. 1. 29.
textsms

navigate_before
1
navigate_next

[논문요약] Chat Vector: Enhancing LLMs via Simple Model Arithmetic

티스토리툴바