top of page

AI 법률 상담 서비스 개발을 위한 텍스트 데이터 수집 및 가공

AI 법률 상담 서비스 개발을 위한 판례데이터 및 문장 수집 및 가공

1. 고객사 소개



고객사는 AI 및 빅데이터 솔루션 전문 기업으로 자연어처리, 이미지 인식 등의 분야에서 탁월한 프로젝트를 수행하고 있습니다. 특히, 리걸테크(Legal+Tech) 분야에서 AI를 활용한 법률 상담 서비스를 제공함으로써 소비자에게 합리적인 비용으로 고품질의 법률 서비스를 접근 가능하게 만들었습니다. 이를 통해 법조시장에 혁신과 부가가치를 도입하는 것을 지향하고 있습니다. 



2. 과제


고객사는 법률상담 서비스용 학습 데이터 수요가 있었습니다. 판례문 텍스트 데이터를 사용하기 위해 법적 전문 용어를 간단히 하고, 긴 문장을 분리하며, 개인 정보를 마스킹해야 했습니다. 이런 복잡성과 민감성 때문에 적절한 데이터 가공 업체를 찾기 어려웠습니다. 이러한 요구 사항과 가이드라인을 만족시키기 위해 고객사는 틱택코리아에 데이터 수집 및 가공을 요청했습니다. 



3. 작업내용


공공데이터포털에서 제공하는 판결문을 고객사 가이드라인에 따라 크롤링해 원천 데이터를 수집했습니다. 이를 틱택코리아에서 파이썬으로 문장별로 분리하고, Tictag 앱으로 데이터를 가공하였습니다. 법률 전문가들의 도움으로 텍스트 라벨링을 완료하고, 가공된 최종 데이터를 고객사에게 제공했습니다. 



Tictag 앱을 활용한 텍스트 가공 예시




판결문 데이터는 대부분 익명화처리가 되어 있으나, 2013년 이전 데이터에서는 익명화가 미흡할 수 있다는 대법원의 안내에 따라, 이름, 주소, 주민번호, 시간 등의 모든 개인정보는 철저하게 마스킹 처리했습니다. 


틱택코리아에서 수행한 세부 작업은 아래와 같습니다. 


A. 판례데이터 수집 및 가공

B. 개인정보 비식별화 처리

C. 법률 어휘를 일반 용어로 전환 

D. 용어 사전으로 자연스러운 번역

E. 긴 문장의 분리

F. 분리 문장의 독립적 가공 

G. 판례문의 긍정/부정적 표현 평가 및 문장 작성



4. 틱택의 솔루션: 작업 결과


틱택코리아는 5개월 동안의 프로젝트에서 고객사의 요구사항과 가이드라인을 준수하여 텍스트 수집 및 가공 작업을 효율적으로 수행하였습니다. 법률 어휘의 복잡성과 민감한 정보 처리에 대한 도전에도 불구하고, 전문가 팀의 노력으로 해당 작업을 성공적으로 완료하였습니다. 


본 작업의 결과물로 저희는 고객사에게 5만개의 판례문 및 30만개의 문장을 성공적으로 가공하여 전달하였습니다. 


틱택코리아는 고객사와의 사전 미팅을 통해 과제를 깊이 이해하고 시작하며, 지속적인 모니터링으로 데이터 품질과 작업의 효율성을 확보합니다.



bottom of page