PDFファイルには、「テキスト形式」と「画像形式」の2つがあります。
PDFファイルを取り込むと、取り込んだPDFがテキスト形式の場合には画面上部のキャプションバーに「テキスト認識」と表示されます。画像形式の場合には「画像認識」と表示されます。
テキスト認識では、PDFに埋め込まれた音符や音楽記号を文字コードとして認識するため、比較的正確な認識結果が得られます。
画像認識では、画像ファイルと同様に画像の編集やページの入れ替えを行うことができますが、テキスト認識では、これらを行うことはできません。
テキスト形式のPDFは、データ構造が多様なため、見た目は音符や文字が正しく表示されていても、コード体系が取得できないなどの理由で、特定の音符や記号が全く認識できないことがあります。このようなときは、PDFファイルの登録からやり直し、「強制的に画像認識」を選択して認識させたほうが良い結果が得られることもあります。