Large Language Model의 약자로, 대규모 텍스트 데이터로 훈련된 인공신경망 모델이다.

자연어 이해와 생성 능력을 갖고 있다.

주로 트랜스포머 아키텍처를 따르며,
주어진 컨텍스트를 기반으로 다음 토큰을 예측하도록 훈련된다.

대표적 모델로 GPT와 BERT가 있다.