: 楽譜認識編 > ページ登録ステップ > PDFファイルの登録 > テキスト形式と画像形式

テキスト形式と画像形式

PDFファイルには、「テキスト形式」と「画像形式」の2つがあります。

PDFファイルを取り込むと、取り込んだPDFがテキスト形式の場合には画面上部のキャプションバーに「テキスト認識」と表示されます。画像形式の場合には「画像認識」と表示されます。

テキスト認識では、PDFに埋め込まれた音符や音楽記号を文字コードとして認識するため、比較的正確な認識結果が得られます。

画像認識では、画像ファイルと同様に画像の編集ページの入れ替えを行うことができますが、テキスト認識では、これらを行うことはできません。

テキスト形式のPDFは、データ構造が多様なため、見た目は音符や文字が正しく表示されていても、コード体系が取得できないなどの理由で、特定の音符や記号が全く認識できないことがあります。このようなときは、PDFファイルの登録からやり直し、「強制的に画像認識」を選択して認識させたほうが良い結果が得られることもあります。