자연어처리 — 사이트랭킹위키

# 자연어처리

**자연어처리**(自然語處理, Natural Language Processing, NLP)는 컴퓨터가 인간이 일상적으로 사용하는 언어를 이해하고 생성할 수 있도록 하는 인공지능 기술이다. 컴퓨터 과학의 하위 분야이면서 인공지능과 밀접하게 연관되어 있으며, 정보 검색, 지식 표현 및 추론, 전산언어학 등 여러 학문 분야와 교차된다. 자연어를 컴퓨터가 처리하기 위해서는 프로그래밍 언어로 변환해야 하는데, 이 과정을 통해 기계가 인간의 의도와 의미를 파악할 수 있게 된다.

자연어처리의 주요 처리 작업으로는 음성 인식, 문서 분류, 자연어 이해, 자연어 생성이 있다. 이 분야는 언어학과 언어 인지 과학을 기반으로 하며, 구현 과정에서 수학적·통계적 도구와 특히 기계학습 기법을 광범위하게 활용한다. 정보검색, 질의응답 시스템, 문서 자동 분류, 신문기사 클러스터링, 대화형 에이전트 등 다양한 실제 응용 분야에서 활발하게 이용되고 있다.

최근 자연어처리 기술은 획기적인 전환점을 맞이했다. Transformer 모델과 이를 기반으로 한 대규모 언어 모델(LLM)의 등장으로 사전 훈련된 거대 신경망을 활용하여 여러 언어 이해·생성 작업을 동시에 수행할 수 있게 되었다. 현재는 이러한 작업들을 하나의 사전 훈련 모델에 통합한 후 특정 과제에 맞게 파인튜닝하거나, 벡터 임베딩과 검색 강화 생성(RAG) 기법과 결합하는 방식이 널리 채택되고 있다. 이러한 기술 발전은 자연어처리의 성능과 활용 범위를 크게 확대하여 기계 번역, 감정 분석, 텍스트 요약 등 더욱 정교한 언어 작업을 가능하게 하고 있다.