PPTファイルの索引データを作成する

https://github.com/kencoba/PPT2Index

PowerPointファイルの索引データ(キーワードとページ番号リストの対)を
出力するプログラムを作成した。

PPT2Index.bat PowerPointファイル テキストデータ抽出ファイル 索引用キーワードファイル

として実行する。

「テキストデータ抽出ファイル」とは、PowerPointファイル中の
スライド、ノートのテキストデータを抜き出したxmlファイルである。
PPT2Indexが作成する中間ファイルである。

「索引用キーワードファイル」は、単に索引として抜き出したい
キーワードを並べたファイル。
以下のような内容である。

                                            • -

オブジェクト
メッセージ
属性
操作
クラス
インスタンス

                                            • -

出力結果は、上記索引用キーワード、タブ、スライド番号リスト(カンマ区切り)
が並んだ形で出力される。
たとえば以下のようになる

                                            • -

オブジェクト 12,13,18
メッセージ 12,13,24
属性 14,15
操作 15
クラス 25
インスタンス 27

                                            • -