- 追加された行はこの色です。
- 削除された行はこの色です。
- Tika へ行く。
TITLE:Tika, a content analysis toolkit
[[Java]] > [[Java/PDF]] > [[Tika]]
- https://tika.apache.org/
- https://tika.apache.org/1.10/formats.html 対応フォーマット
*. [#p2a245a4]
- 様々なファイルからテキストとメタデータを抽出できるライブラリ「Apache Tika」
-- http://www.vintage.ne.jp/blog/2014/10/346
- Apache Tika
-- http://winddy.hatenablog.com/entry/2014/05/21/165531
* 関連 [#rel]
- [[PDF]]
- [[Office/Word]] - [[Excel]]
- [[HTML]] - [[XML]]
- [[MP3]]
- [[JPEG]]