토큰

글자 수와 같지 않은 모델의 처리 단위. 비용, 속도, 기억 범위를 모두 건드립니다.

도구 호출

모델이 외부 기능을 쓰도록 구조화한 절차. 응답문과 실행 결과를 구분해 읽어야 합니다.

환각

그럴듯하지만 근거가 약한 생성 결과. 검색 보강만으로 사라지지 않고 평가 설계가 필요합니다.

시스템 메시지

대화의 상위 규칙. 짧게 쓰는 것보다 충돌과 예외를 줄이는 방식이 중요합니다.

재순위화

검색된 후보를 다시 정렬하는 과정. 출처 품질과 질문 의도 사이의 균형을 봅니다.

증류

큰 모델의 행동을 작은 모델이나 고정된 절차로 옮기는 접근. 손실되는 맥락을 기록해야 합니다.