엑소브레인 - 내몸 밖에 있는 인공 두뇌
컴퓨터가 언어를 이해하고, 지식을 학습하여, 지식을 서비스하는 AI 기술
전문분야에서 질의응답을 통한 지식 제공 서비스
위키백과 및 신문기사 23.5gb(약 15년 분량, 47억개 형태소 ) 데이터 학습
22만개 이상의 질문-단락-정답 을통한 기계독해 학습데이터
1. 심층 자연어 분석
> 텍스트에 기술된 언어의 뜻과 의미를 분석
> 단계별
1. 문장 분리
2. 형태소 분석
> 문장을 명사/동사/형용사/조사/원마 같이 분리
3. 동음이의어 및 다의어 분석
> 정확한 의미를 인식하는 기술
> 국어사전의 여러가지 의미에서 몇 번째 의미 인지 분류
4. 의존구문분석
> 문장의 구조를 구문트리 또는그래프형태로 표현
5. 개체명 인식
> 단어에 대해 직업/장소/영화/사람과 같이 분리
6. 정규화
7. 의미역인식
2. 딥러닝 언어모델
언어모델 ( korbert )
> 형태소 단위모델 / 워드피스 단위모델 / 라지 모델
딥러닝 응용 기술
> 기계독해 기술(Kobert), 엑소브레인 형태소 분석, 문장 간 유사도 인식기술(Kobert), 텍스트 분류 기술(문장/문서)(Kobert)
챗봇
>전자계약서 자동생성, 건설현장 전문가 자문 서비스, AI빅데이터 기반 완전판매 모니터링
3. 뉴럴문장이해
4. 심층질의응답 ( 플랫폼 )
법령, 규정 등 전문가에 대응하는 답변을 제공
1. 질문 > 2. 자연어 분석 > 3. 질문 분류 > 4.심볼릭 기반,
5. 검색/재순위화(Korbert 기술 재순위화 / 근거(질문/근거인식/기계독해)
6. 오피스문서 색인 DB,
7. 단락/테이블 색인,
8. 색인 데이터(json). 9. 가상문서 전처리, 10. 문서 데이터,
11. 오피스문서(hwpx)
공정위[ 공정거래 분야 심층질의응답
국회도서관 국내/외 법령 분야 심층질의응답