大日本印刷(DNP)は、生成AI(人工知能)の学習に適したデータ形式にPDFやWordなど多様なドキュメントを整形する技術を開発した、と12月14日発表した。生成AIの誤回答や非回答を削減して高精度の回答が得られる。生成AIの学習データ加工・収集に課題を持つ企業・団体に2024年1月から提供し、契約書や帳票類、業務マニュアルが膨大な自治体や金融機関に生成AI活用した業務のDX(デジタル変革)につなげるサービスを開発する。
テキスト、画像、表組みが混在したドキュメントから、タイトルや本文、画像や表の内容、キャプションなどの要素ごとにコンテンツを分割し、生成AIが学習しやすいデータ形式に整形する。大量の文書も高速に処理できる。DNPは、5月に生成AIを活用する社内環境を構築して、社内規定や品質マニュアル、決算短信などのドキュメントを整形して生成AIに学習させることで、誤回答を約90%削減することに成功した。
生成AIは回答精度の低さが課題で、外部から正しい知識、情報、データを与えることが有効とされている。政府も、生成AIの利用ルールを議論する「AI戦略会議」で政府保有のデータを開発者に提供する方針を決めている。ただ多くのデータがPDF形式で、生成AIが効果的に学習・参照するには情報を適切な形に整形する必要があった。この課題を解決するため、DNPは多様なドキュメントを生成AI向けのデータに整形する技術を開発した。
※このコンテンツはWebサイト「Web担当者Forum - 企業Webサイトとマーケティングの実践情報サイト - SEO・アクセス解析・SNS・UX・CMSなど」で公開されている記事のフィードに含まれているものです。
オリジナル記事:DNPが生成AIの回答精度を上げる「ドキュメント生成機能」を開発、24年1月提供開始
Copyright (C) IMPRESS CORPORATION, an Impress Group company. All rights reserved.