はい。全国自治体の条例・規則の90%近くを収集したデータベースを作り、類似例規(=条例+規則)を検索できるシステムを開発して、2012年に全国の自治体に提供しました。
自治体の例規は自治体ごとに分散しており、それぞれ異なる方式で開示されているため、インターネットから自動で集めることは困難でしたが、それでも手作業や直接のデータ提供も含め、全国の約9割にあたる約1700の自治体から例規データを集めました。調査のために、実際に全国の60以上の市町村役場に足を運んで詳しくインタビューしたり、現場を見せて頂きました。北海道から沖縄まで、いろいろなタイプの自治体に伺いました。苦労しましたね。地方自治体の例規担当者の実情を知ったのも、このときです。
せっかく例規データを集めても、自治体によって例規のデータ形式がバラバラだったため、検索可能にするためには、まず、すべての例規を統一規格に揃える必要がありました。さらに、条文の内容はほぼ同じなのに、項目名が異なるために「別の種類の条文」と判断されてしまうことがあったため、AIによるクラスタリングで、条文内容が似たものは類似検索結果として表示させるようにしました。
はい、ただ、あくまでもこの場合は、目に見えない仮想の上位概念ということになります。実は、類似物のクラスタリングとは、未知のものを含む何らかの概念に属する要素を集めることに相当します。
この類似判定結果のデータは、104 TB(テラバイト)という膨大な量になりました。本研究の「法情報データ」は、このデータを基に抽出・加工された各種のデータです。
この研究の目的は、単に条例作成担当者の仕事の機械化や効率化を目指すだけではなくて、法令そのものの質の向上も目指しています。
条例の作成中「何らかの理由で条文の一部を変更したところ、他の条文との矛盾が出てしまった」という失敗談をよく聞きます。本システムでは、条文の一部を変更したときは、その条文に関わる他の条文も自動的に変更することで、条例全体に矛盾が生じないよう調整されます。単に文章を挿入するのではなく、その条例における一つひとつの項目の意味を提示し、必要な内容を記入して作成するため、間違いの発生を抑えることができるのです。
以前はコンピュータのスペックが足りなくて実現できなかったことが技術革新により可能になったが、あくまで推論の機械化という領域で研究を続けた
可能です。法令プログラミング用の言語にPython(パイソン)言語を採用したのは、応用を広げるために必要に応じたカスタマイズや、ライブラリを追加するなどして機能拡張を容易にするためです。
法令は人間が安全・安心な社会生活を送るための基盤です。この研究を通して社会全体への貢献ができればと考えています。