" 比較オプション" タブにある項目は次の通りです:
オプション |
説明 |
大文字小文字を無視 |
文字の大文字小文字の違いを無視します。 |
空白文字を無視 |
空白文字(水平タブ、垂直タブ、新しい行、用紙送り、復帰改行、およびスペース)を無視します 。 |
空白行を削除 |
表示されていない文字内容を持つ行を比較する前に削除します。 |
空白行を無視 |
完全に空白の行を無視します。空白文字のみは空白行とはみなされません。 |
フォーマットを削除 |
あらゆるフォーマットを削除します。結果、比較がより速くなります。 |
作業完了をビープ音で通知 |
設定すると、比較完了後にシステムのビープ音が鳴ります。 |
文字単位で比較する |
文字単位で比較します。結果、速度が遅くなりますが、より詳細に比較します。 |
F5 または ボタンを押すと、相違点ビューアが更新されます。この時、オプションで比較を行う前に、選択したファイルをオリジナルエディタと修正エディタに再ロードしたり、上記のエディタにすでにあるテキストを単純にスキャンして相違点をチェックします。
このオプションは、保存したファイルを比較するだけでなく、オリジナルエディタと修正エディタにコピー&貼り付け(または直接作成)でテキストを比較するのに大変便利です。
'ファイルの比較'ツール内のすべてのエディタに対しページの上下左右の余白をここで設定できます。 MS Word スタイルのレポートを作成してMS Word からそのレポートを開いて印刷した方が、良い印刷結果が得られます。例えば、下線はMS Word 内では二重下線になり、より好まれます。
オリジナルファイルまたは修正ファイルを開く際に要求されるパスワードをここで設定します。
ここで、比較するワークシート、列、行を指定でき、式を比較対象にするかどうか設定します。
'Diff Doc'が Excel データで読み込む場合、各シート上部にシート名を挿入するように設定できます。これは一度に2つ以上のシートを比較する場合に便利です。
比較範囲を狭くすることでより速く、簡潔にレポートを作成できます。また、新しい行を追加するオプションはレポートを印刷するのに便利です。
空白でセルを埋めたい場合、想定した列数、フィールド数の最大値を設定します。
Excel データクイック抽出はSoftinterface の内部メソッドを使用し、Excel ファイルからデータを取得します。これはExcel を使用するよりも速く、また、Excel を持っていない場合、大変便利です。最後に、Excel ファイルを開くパスワードを要求される場合、ここで設定します。パスワード保護されたファイルの場合、Excel データクイック抽出オプションは使用できませんのでご注意ください。
'Diff Doc' は事前処理なしで直接テキストファイルを読み込みます。更に、ファイル拡張子に基づいて、Diff Doc が適切にテキストファイルを取り扱えるようにする必要があります。ファイル比較でエラーにならないように、非標準の拡張子のファイル拡張子(例apples.abc)を使用している場合、リストにファイル拡張子を追加して下さい。
注: テキストファイルのみに使用するファイル拡張子だけを追加してください。
オプションでスライドとシェイプ番号を比較内容に含めるかどうか選択できます。これは、比較結果がより分かりやすく、ハイライトされるのでお勧めします。
各スライド内のノートを比較内容に含めるかどうか選択できます。
また、どのスライドを比較するか指定できます。比較範囲を狭くすることでより速く、簡潔にレポートを作成できます。
HTML ソーススクリプトの比較には、このオプションをオンにする必要があります。ブラウザで表示される一般的な内容のみを比較する場合は、このオプションはオフにして下さい。
パスワード: ユーザーパスワードとオーナーパスワードの入力欄があります。' Diff Doc' はPDF ファイルのインポートを断念する前に、両方のパスワードの使用を試みます。
項の指定: ここで比較するページの範囲を指定できます。PDFファイルがどのように作成されたかによって、最適な結果を得るために、PDF インポートオプションの設定が必要な場合があります。2つの主要なインポート方法があり、"高速なテキスト抽出" と"厳密なテキスト抽出"から選択します。"高速なテキスト抽出"は表記の通り、高速ですがフォーマットが失われます。"厳密なテキスト抽出"は次に詳細を説明しますが,"高速なテキスト抽出"よりもより種々様々なPDF のインポートが出来る方法となります。
厳密なテキスト抽出:
"厳密なテキスト抽出"には3つの変換オプションがあります。通常の PDF ファイルのインポートには、" テキストフロー"変換方式の使用をお勧めします。
PDF がスキャンされたイメージで、テキスト内容を含んでいる場合、"テキストを含むOCR処理されたイメージのPDFファイルを実行"変換方式を使用して下さい。注: 'Diff Doc'はPDF またはイメージ上で OCR処理は行いません。しかし、OCR 処理されたものや、テキスト情報を含んだ PDF ファイルを処理できる場合があります。
全体オプション
オプション |
説明 |
ハイフンを結合する |
ハイフンは時々、ページの幅が超えた場合に分割された単語をつなげる為に使用されます。 分割された単語がそれぞれ別の単語として表示されることを避けたい場合は、このオプションをオンにします。 |
隠れた文字を削除する |
例えば、文書が白色文字と白色の背景色になってい る場合、このオプションをオンにすると、テキストが削除されます。 |
変換方法
オプション |
説明 |
変換方法 |
変換方法には3つのオプションがあります。入力フォーマットに従って、それぞれ選択してください。 テキストフロー(推奨) – 文書からテキストとグラフィックを抽出しますが、オリジナルのレイアウトを保持しません。1列または複数列の文書に対し利用可能です。 テキストフローを選択した場合、PDF の比較はより簡単になります。PDF ファイルのフォーマットの詳細については、文書レイアウトをご覧ください。
スペースとタブを使用してレイアウトを保持する – 1列の文書に対し利用可能です。結果の文書内のテキストの位置はテキストボックスの代わりにタブとスペースを使用してオリジナルのレイアウトを保持します。 PDF ファイルのフォーマットの詳細については、文書レイアウトをご覧ください。
テキストを含むOCR 処理されたイメージのPDFファイルを実行– 名称が示すように、OCR処理されたテキスト内容を含む文書に対しこの方法を使用します。注: 'Diff Doc'はPDFまたはイメージファイルでOCR を実行しません。 |
“テキストフロー”と”スペースとタブを使用してレイアウトを保持する “詳細オプション
オプション |
説明 |
フォント名の調整 |
PCにインストールされているフォントを使用する場合、このオプションを選択します。これは、RTF ファイルの結果の正確性をより強化します。 |
ヘッダを検出する |
‘スペースとタブを使用してレイアウトを保持する’ 変換オプションを選択している場合のみ利用できます。 選択した場合、'Diff Doc' は文書のヘッダとフッタを自動検出します。 |
ドキュメントレイアウト |
3つのタイプがあります: シングルカラム –列を含んでいないシンプルな文書に対し使用します。 マルチカラム –列を含んでいる複雑な文書に対し使用します。この文書タイプには、テキストフロー方法を選択します。 法的文書 – 特に法的文書フォーマットを持つ文書に対し使用します。 |
ハイパーリンクの抽出 |
オリジナル文書のハイパーリンクを保持するにはこのオプションを選択してください。 |
パラグラフの結合 |
パラグラフにテキストの複数行を配置するにはこのオプションを選択します。 これで、より簡単に編集ができますが、特定の状況で文書がオリジナルと異なって見える原因となります。 これは、PDF とRTF 間のフォントの不適合によります。
’厳密なテキスト抽出’オプションを使用している場合、この結合オプションを必ず選択してください。 |
フォントの縮小 |
このオプションを選択すると、テキストの大きさが画面上のオリジナルの領域内に収まるように調整されます。 これは抽出したテキストが非常に長い場合、便利です。 このオプションはRTF文書のテキストボックス内に収まるようにフォントサイズが自動で変更されます。このオプションは’ ’厳密なテキスト抽出’オプションを使用している場合のみ、利用できます。 |
関連項目: