: 楽譜認識編 > ページ登録ステップ > PDFファイルの登録 > テキスト認識と画像認識

テキスト認識と画像認識

PDFファイルには、「テキスト形式」と「画像形式」の2つがあります。

登録したPDFファイルがテキスト形式の場合には画面上部のキャプションバーに「テキスト認識画面」と表示されます。画像形式の場合には「画像認識画面」と表示されます。

また、テキスト形式の場合は楽譜の背景(用紙の外側)が赤みがかった色になります。

テキスト形式のPDF

(他社製を含む)楽譜作成ソフトで出力されたPDF形式の楽譜の多くは、音符や音楽記号が文字として埋め込まれています。その文字コードを直接認識(テキスト認識)することで、正確な認識結果が期待できます。

「ページの選択」ダイアログボックスの「認識方法」で自動判別に設定されていると、テキスト形式のPDFは自動的にテキスト認識します。

テキスト形式のPDFはデータ構造が多様なため、見た目は音符や文字が正しく表示されていても、コード体系が取得できないなどの理由で特定の音符や記号が全く認識できないことがあります。このようなときは、PDFファイルの登録からやり直し、「強制的に画像認識」を選択して認識させたほうが良い結果が得られることもあります。

画像形式のPDF

紙の楽譜をスキャナでスキャンしたPDFなどは、画像形式です。

画像形式のPDFは、通常の画像ファイルを登録したときと同じように、あとで追加(複数登録)することができます。

画像認識では、画像ファイルと同様に画像の編集ページの入れ替えなどを行うことができますが、テキスト認識では、これらを行うことはできません。