Top > Tika TITLE:Tika, a content analysis toolkit [[Java]] > [[Java/PDF]] > [[Tika]] - https://tika.apache.org/ - https://tika.apache.org/1.10/formats.html 対応フォーマット *. [#p2a245a4] - 様々なファイルからテキストとメタデータを抽出できるライブラリ「Apache Tika」 -- http://www.vintage.ne.jp/blog/2014/10/346 - Apache Tika -- http://winddy.hatenablog.com/entry/2014/05/21/165531 * 関連 [#rel] - [[PDF]] - [[Office/Word]] - [[Excel]] - [[HTML]] - [[XML]] - [[MP3]] - [[JPEG]] |