ハーバード大学ロースクール図書館は本日、ハーバード大学ロースクール図書館が図書館、博物館、政府機関、その他の機関と協力してコレクションをデータ形式で公開する研究イニシアチブである機関データイニシアチブの立ち上げを発表しました。このデータは、人工知能モデルのトレーニングなど、さまざまな目的に使用できます。
Institutional Data Initiative (IDI) は、まずハーバード大学の図書館によってスキャンされた 100 万冊のパブリック ドメイン書籍の改良に焦点を当てます。また、ボストン公共図書館と協力して、数百万ページにわたる歴史的な新聞をデータとして利用できるようにする予定だ。これらのデータセットは長いテキストですが、IDI は他の機関と協力して、科学データや生物医学データを含むさまざまな形式のデータを開発することを検討しています。
IDI の立ち上げは Microsoft と OpenAI によってサポートされています。長期的な資金調達のために、IDI はいくつかの慈善団体や業界支援者と提携する予定です。
Microsoft 副社長兼副法務顧問 Burton Davis は、IDI について次のような見解を表明しました。
「マイクロソフトは、すべての AI ビルダーの知識と高品質なデータへのアクセスを増やすために取り組む Institutional Data Initiative の設立を支援できることを誇りに思っています。私たちはデータへの広範なアクセスを可能にし、より包括的な AI エコシステムを強化することに取り組んでいます。2020 年以来、私たちはデータ格差を解消し、すべての組織が革新とさらなる達成に必要なデータに確実にアクセスできるように取り組んできました。これは活気に満ちた競争力のある AI 経済の成長に不可欠です。」
Microsoft は、オープンで利用可能なデータを中心としたコラボレーションから誰もが恩恵を受けることができると常に信じてきました。実際、Microsoft は 2020 年の初めに、あらゆる規模の組織が人工知能アプリケーションの開発に必要なデータにアクセスできるようにするオープン データ運動を開始しました。
OpenAI の知的財産およびコンテンツ担当ディレクターである Tom Rubin 氏は、IDI の立ち上げについて次のように述べています。
「学術機関は長い間、AIの研究と進歩において重要なパートナーであり、ハーバード大学の機関データイニシアチブはその好例です。パブリックドメインは知識と創造性を広める上で重要な役割を果たしており、OpenAIはこの取り組みをサポートすることに興奮しています。私たちはこの重要なプロジェクトにおけるZittrain教授のリーダーシップに触発されており、それが与える影響を非常に楽しみにしています。」
IDI は、簡単にアクセスできる大規模なデータ セットを提供することで、人工知能テクノロジーの進歩とすべての人へのアクセスのしやすさに貢献しています。