AI連携へデータ化
データテック社では、RDBに保存されていた法令・判例データをXMLデータとして、そのまま活用する取り組みを始めています。すべての法令・判例データをAIでスムーズに解析することを目指しています。膨大なデータ量ですが、独自のデータ変換技術で、従来とは比較にならない短時間で全てのデータをAIが解析できる言語にデータ変換することを可能にしました。データの格納もRDBとは比較にならない低コスト大量の法律情報のデータ化を実現できます。この法律データ基盤技術が、AI弁護士やAIによる立案の実現に欠かせないもとと考えています。
AIに法令を学習させれば法案の作成も可能に
法令の内容や裁判の記録、事件・事故の詳細といった情報のデータ化が進んでいき、データのXML化が実現できれば、法務業界においてもAIやビッグデータ活用の可能性が広がります。戦略的にIT化を進めてきた韓国の法務業界では、すでに電子訴訟制度が確立されており、訴えの提起や訴訟の手続き・進行を電子訴訟システムで行えるまでに進んでいます。「AIによる立法化」の研究も進んでいます。
世界中の政策データをAIに学習させ、最も適した法令をAIに立案させようという取り組みです。法案を作る際には、他の法律との矛盾や見落としがないかを調べる必要があります。そういった作業は現在は人間の仕事ですが、かなりの手間と時間がかかっています。その作業をAIに任せることで法務業界の効率化が劇的に改善されます。その為には、法令に関するデータやこれまでの法案のデータなどをすべてXML化した上でAIに学習させておくことが必要です。
既存の法律データベースの課題
-
未だ紙の資料が多く閲覧条件も厳しくデータ化するには国の許可が必要になる
-
RDBに格納されている法律データは検索が遅く必要な判例を探し出すのに時間がかかる
-
PDFのままのデータも多くテキスト化されていないので検索することもできない動画や音声なども同様
AIやビッグデータなどでデータを活用するには、元のデータをしっかり活用できる形に変換しておくことが絶対に欠かせません。石油に例えれば原油を精製してガソリンや軽油などに変えていくイメージです。今後は、そういった「データの精製」ノウハウが重要な時代になっていくとデータテック社では考えています。データテック社の法律データ基盤技術は、AIが学習するためにあらゆる法律デー タをXMLに変換する、データの精製と、そのデータをRDBを使わずに格納する次世代データベース構築までを含めたトータルソリューションで、AI時代の法曹界を支援します。
XML変換技術を活用したを次世代の法律データベース
データテック社のXML変換技術を活用して、さまざまな非構造化データ、テキスト化されていないPDFデータなどをAIで解析できる共通フォーマットにコンバートすることができます。データテック社独自のテクノロジーで、膨大なデータも短時間でXMLデータに変換して、既存のデータベース構築では考えられないほどの抵コストで、あらゆる法律データを高速検索可能な形に加工します。
人間による立案では「思い込み」や「忖度」が少なからず影響することがありますが、効率化に加えて公平性を高める意味で、AIによる立案のサポートをやってみる価値はあります。そのためには、AIを学習させるデータを豊富に用意できる環境を作ることが急務となります。韓国ではすべての法令・判例データをXML化する取り組みが始まっています。法務関連のデータ化に関して言えば、実は韓国では訴訟の内容なども含めたすべての法令・判例データが電子化されています。データは約600万件に及びます。ただし、それはすべてRDBに格納されているため、柔軟な設計変更ができず、人工知能が自由にデータにアクセスできるようなパフォーマンスを発揮できないという問題があります。
既存の法律検索サービスは、RDBに保存された法律データをデータベースから検索するという形で利用されています。データテック社は、法律データをXML変換技術でにコンバートした後、データをそのまま、AI検索にかけることで、探したいデータを人工知能が素早く見つけ出せる次世代のシステムを構築しました。データテック社のテクノロジーは、高速でコストの安い次世代の法律検索サービスを生み出すことに成功しました。
データベースの比較
従来の法律データベース |
AIに適した次世代データベース |
RDBに大容量データを格納しているためAIでアクセスするには \パフォーマンス低い
|
XMLデータをそのまま検索エンジンにかけるAIに適した次世代データベース
|