-
CS336: 처음부터 만드는 언어 모델링 | GeekNews
<ul> <li><strong>언어 모델</strong>은 현대 NLP 애플리케이션의 기반이며, 하나의 범용 시스템으로 다양한 하위 작업을 다루는 새 패러다임을 연다</li> <li>이 과정은 사전학습용 <strong>데이터 수집·정제</strong>, Transformer 구축, 학습, 배포 전 평가까지 언어 모델 개발…
-
AWS에서 기초 모델 학습 및 추론을 위한 구성 요소
Building Blocks for Foundation Model Training and Inference on AWS
-
Sentence Transformers를 이용한 멀티모달 임베딩 및 리랭커 모델 학습과 파인튜닝
Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers
-
TRL v1.0: 분야와 함께 성장하는 포스트-트레이닝 라이브러리
TRL v1.0: Post-Training Library Built to Move with the Field
-
ImportAI 449: LLM이 다른 LLM을 학습시킴; 72B 분산 학습 실행; 컴퓨터 비전은 생성 텍스트보다 더 어렵다
ImportAI 449: LLMs training other LLMs; 72B distributed training run; computer vision is harder than generative text
Will AI cause a political interregnum