
수요기업 챌린지
"법률 상담 서비스를 개발을 위한 법률 데이터 수집 및 가공이 필요합니다."

수요기업은 리걸테크(Legal+Tech) 분야에서 AI를 활용한 법률 상담 서비스를 제공하여 소비자들이 합리적인 비용으로 고품질 법률 서비스를 이용할 수 있도록 지원하고 있습니다. 이를 통해 법조 시장에 혁신을 도입하고 부가가치를 창출하는 것을 목표로 하고 있습니다.
수요기업은 변호사 상담 비용 부담을 완화하고 법률 서비스에 대한 접근성이 낮은 소외 계층을 지원하기 위해 데이터바우처 사업에 지원하며, 법률 서비스 개발의 기반을 다지고자 했습니다.
법률 상담 서비스를 개발하기 위해서는 판례문 텍스트 데이터가 필수적이었습니다. 이 과정에서 법적 전문 용어를 간소화하고 긴 문장을 분리하며, 개인 정보를 철저히 마스킹하는 작업이 필요했습니다. 그러나 이러한 작업은 높은 민감성과 복잡한 요구 사항 때문에 적합한 데이터 가공 업체를 찾는 데 많은 어려움을 동반했습니다.
이에 수요기업은 틱택코리아를 데이터 가공 공급기업으로 선택하여 프로젝트를 성공적으로 추진할 수 있는 기반을 마련했습니다.
Step 1.
판례문 데이터 수집


공공데이터 포털에서 제공하는 판결문 데이터를 기반으로, 수요기업의 가이드라인에 따라 크롤링 작업을 수행해 총 50,000건의 원천 데이터를 수집했습니다.
수집된 판결문 데이터는 대부분 익명화 처리가 되어 있었지만, 대법원 고문에 따르면 2013년 이전 데이터의 경우 익명화가 미흡할 가능성이 있었습니다. 이에 따라, 개인정보 보호를 위해 비식별화 처리 작업을 추가로 진행했습니다.
Step 2.
판례문 데이터 가공

전문적인 법률 어휘를 일반 대중도 쉽게 이해할 수 있도록 일반용어로 전환하는 작업을 수행했으며, 이를 위해 법률 용어 사전을 활용해 자연스러운 번역을 구현했습니다.

또한, 판례문 내 긴 문장을 분리하여 가독성을 높이고, 분리된 문장이 독립적으로 활용될 수 있도록 세밀한 가공 과정을 거쳤습니다.
이 작업은 틱택의 자체 데이터 라벨링 툴을 활용해 진행되었으며, 이를 통해 작업자들이 텍스트 라벨링 작업을 보다 쉽고 빠르게 수행할 수 있었습니다. 더 나아가, 판례문 내 긍정적/부정적 표현을 체계적으로 식별하고 이를 기반으로 새로운 문장을 작성함으로써 데이터 응용 가능성을 확장했습니다.
프로젝트 결과
"판례문 데이터 5만 건 수집과 법률 문장 30만 개 가공을 성공적으로 완료했습니다."
데이터바우처 작업을 통해 50,000건의 판례문 수집과 약 300,000문장의 판례문 텍스트를 가공했습니다. 이번 데이터 가공 작업은 단순한 텍스트 처리에 그치지 않고, 데이터의 가치를 한층 더 높이는 정교한 과정이었습니다.
이 과정을 통해 틱택코리아는 수요기업이 법률 서비스 개발과 개선에 필요한 고품질 데이터를 확보하는데 기여했습니다.
"데이터바우처, 미리 준비하면 합격률이 높아집니다"

데이터바우처 사업에 성공적으로 선정되기 위해서는 철저한 사전 준비가 필수입니다.
틱택코리아는 4년 연속 데이터바우처 공급기업으로 활동하며 축적한 전문 노하우를 바탕으로 데이터바우처 사업의 성공을 돕고 있습니다.
아래 이미지를 눌러 지금 바로 무료 컨설팅을 신청하세요!
성공적인 데이터 활용 여정에 함께 하겠습니다.
Comments