Fujitsu The Possibilities are Infinite

元のページへ戻る

  1. ホーム >
  2. ソフトウェア >
  3. DynaEye >
  4. DynaEye Pro >
  5. よくあるご質問(FAQ) >
  6. よくあるご質問 回答

DynaEye Pro よくあるご質問 回答

帳票認識に関するご質問

Q1

ひな型と認識する帳票の解像度は異なっていても構いませんか?

A1

DynaEye Proでは、書式定義に使用したひな型の解像度と、その書式定義を使って帳票認識を行なう帳票の解像度は一致している必要があります。
なお、書式定義の解像度を変えることはできません。ひな型イメージから取り直す必要があります。



Q2

フィールド情報ダイアログで「知識処理」を指定しているのですが、知識処理の効果が感じられません。

A2

定義のメニューから知識処理情報を選択してダイアログを開き、 知識処理の内容と処理したいフィールド名を設定してください。 DynaEye V1.1では、フィールド情報ダイアログの「知識処理情報」は、 字種を限定するための設定情報であり、ここの設定だけでは知識処理が機能しません。



Q3

認識率がとても悪いんですが?

A3

以下に該当しないかご確認ください。

  • スキャナの読み取り濃度は適切ですか?

    薄過ぎても、濃過ぎても文字認識には悪条件となります。 スキャナ濃度についてのご質問などを参考にして、適切な濃度で読み取るようにしてください。
    帳票の紙質が適切でない(地色がある用紙、薄い用紙、裏カーボン紙など)場合や、スキャナの劣化・汚れなどにより、 画質が悪くなり認識率が低下することもあります。
    スキャナに関しては、fiシリーズ イメージスキャナのFAQやお問い合わせまでお願いします。
スキャナの読み取り濃度の設定
TWAINダイアログを表示せずに読み取りを行なっている場合 標準アプリケーションを使用している場合 <ファイル>メニューから<スキャナ情報設定> を実行して、「スキャナ情報設定」ダイアログを開き、閾値を調整する。
DynaEye部品を使用している場合 パラメタファイルのbrightの値を調整する。
DynaEye関数を使用している場合 DynaEye_Scan構造体のbrightの値を調整する。
DynaEyeコンポーネントキットを使用している場合 スキャナコントロールの Thresholdプロパティを調整する。
TWAINダイアログから読み取りを指示している場合 TWAINダイアログで調整します。スキャナのマニュアルをご覧ください。
  • 書式定義は適切に定義されていますか?

    • マニュアルで読み取り桁数を設定するとき、桁数を間違えていませんか? DynaEyeは設定された矩形領域を桁数と等分して、その中の文字を 読み取ろうとしますので、桁数が間違っていると精度が悪くなります。
    • 手書き文字を「活字」として定義したり、活字印字を「手書き」 として定義したりしていませんか? 「手書き」と「活字」は包含関係 にないので、適切に定義する必要があります。
    • 知識処理を利用せずに、手書き日本語を認識していませんか? 手書き日本語は「住所」「氏名」等の知識処理を前提としています。
    • 字種を絞り込んでいますか?数字しか記入しない項目に「英字」や 「カナ」まで指定すると、紛らわしい文字が増えて、 リジェクトや誤読が多くなります。

    書式定義のヒントを参考にしてください。

  • 帳票設計は、DynaEye Proの仕様に合っていますか?

    • 文字記入欄が狭い(文字同士、文字と罫線等の印刷が接触する)
    • 1文字毎の桁区切りが印刷されていない(文字同士が接触する)
    • 活字がサポート外のフォントで印字されている
    • 印刷色や罫線等のプレ印刷が帳票照合に適さない
    • ドロップアウトカラー帳票なのに、色がドロップアウトしいない

    などの要因で十分な認識精度が得られないケースがあります。このような 場合は、帳票デザインの変更をお勧めします。



Q4

帳票認識に失敗して、×マークが付いてしまうのですが。

A4

大きく分けると、二種類の原因が考えられます。

  • 書式定義した帳票イメージと、帳票認識させた帳票イメージの不整合。
  • 帳票の特徴が少なく、帳票認識できなかった。

前者に関しては、

  • 書式の異なる帳票イメージを帳票認識させた。
  • 書式定義を作成したイメージと異なる解像度のイメージを帳票認識させた。
  • 書式定義を作成したイメージとスキャナ入力時の設定が違うため、 線がかすれたり、イメージが汚れたりしている。

などが考えられます。これらは適切な設定を行なうことで、読み取り可能です。
後者に関しては、

  • 帳票のプレ印刷部分が少ない。
  • 文字枠だけの単純な繰り返しの帳票である。

などが考えられます。 こちらは、DynaEye Proの読み取り対象とするのが難しい書式です。帳票のデザインを再検討してください。


Q5

手動でアンカーパターンを設定していると、帳票リジェクトがいつも発生するのですが?

A5

手動でアンカーパターンを指定する場合、繰り返し同じようなパターンが出現する部分を設定していませんか? 例えば、「住所・氏名」という文字の上にアンカーを設定していて、そのすぐ下に同じ文字があるようなケースです。 DynaEyeは帳票認識の際に用紙の歪みを吸収する関係上、同じパターンがすぐ近くにあると誤る可能性があります。 アンカーパターンを設定する場合は、類似したパターンがない場所を選んでください。


Q6

モノクロ形式で入力しているのですが、どうしても帳票認識に失敗してしまいます。

A6

モノクロ形式でも、画像の階調を表現するために、 中間調処理やディザ処理を行なうことができるスキャナがあります。DynaEye Proの帳票認識では階調表現をしたイメージを扱うことはできません。 スキャナの設定で、「中間調」「ディザ」「ハーフトーン」といった指定(お使いのスキャナによって異なります) は行なわないでください。


Q7

手書きのひらがなは認識できないのですか?

A7

手書きひらがなは、手書き漢字(日本語)の中に含まれており、認識可能です。 手書き漢字(日本語)として、JIS第一水準漢字・JIS第二水準漢字(一部)の他に、 カタカナ、ひらがな、数字、英字(大文字)を読み取ることができます。


Q8

データチェック機能を使って、2箇所以上の項目を関連させてチェックを行なうことができますか? たとえば、「4月31日」と記入された場合はエラーとするなど。

A8

可能です。例えば、"jdate(4,19,[月],[日])"のようにデータチェック式を記述すると、 「平成19年」を前提として、「月」フィールドと「日」フィールドを連携したチェックができます。


Q9

帳票認識を実行すると、インストール フォルダに "error1.log"、"error2.log"、... というファイルが作成されますが、何かエラーが発生しているのでしょうか? V5.0からは、作業フォルダの下に出力されるようになりました。

A9

帳票認識等の実行時にログ(実行経過)を記録して "error?.log" (?は一桁の数字、1から5まで) というファイル名でインストールフォルダに保存していました。 このファイルは、正常に動作していても作成されますので、特に気にする必要はありません。 なお、DynaEye標準アプリケーション、アプリケーションプログラムインターフェースのいずれを使用しても出力されます。
V3.0からは"DynaEye1.log","DynaEye2.log", ...という名前に変更されています。
V5.0からはインストール時に指定した作業フォルダの配下に出力されるように変更されています。


Q10

活字ANKSフィールドにMS明朝やMSゴシックで印字しているのに、読み誤りが多いのですが?

A10

2バイトコード文字(いわゆる「全角」)で印字していませんか? 認識可能なMS明朝・MSゴシックの印字は、いわゆる「半角」(1バイトコード文字)印字だけです。


Q11

帳票ID識別では、登録していないIDを読み取った場合、エラーになり処理が止まりますか?

A11

書式定義にないIDの帳票を認識した時はエラー(認識失敗)になります。 DynaEye標準アプリケーションやDynaEye部品では、そのページは認識失敗になりますが、次ページの認識処理に進みます。 DynaEyeコンポーネントキットでは、認識メソッドがエラー終了します。その後の処理は、アプリケーション開発次第となります。


Q12

円記号(\)やスラッシュ(/)などの記号が読めないことがありますが、なぜでしょうか?

A12

一部の記号は、数字や英大文字と区別するため、特殊な書き方をする必要があります。 以下に書き方を示します。詳細については、ユーザーズーガイドを参照してください。

記号の書き方


Q13

ドロップアウトカラー帳票を帳票認識すると、イメージが上下逆に回転してしまいます。

A13

以下に該当していないか確認してください。

  • イメージに黒背景が正しく付いていない
    ドロップアウトカラー帳票を読み取る場合、用紙端を検出するために帳票イメージの上下左右に8mm程度の黒帯(黒背景)が必要です。 黒背景が欠けている・かすれているなどの場合、用紙端の検出に失敗し帳票の向きを誤る場合があります。 黒背景に欠けやかすれがある場合、以下の点を確認してください。
    • ドロップアウトカラー帳票用の指定のスキャナを使用しているか
    • スキャナの読み取りパラメーターを正しく設定しているか
  • 用紙を誤った向きにセットしてスキャナ入力した
    ドロップアウトカラー帳票は用紙の向きを自動検出できないため、間違った向きのイメージが入力されても正しい向きに直しません。 用紙の向きが正立、あるいは左90度回転(横長帳票の場合)の状態で帳票認識してください。

Q14

ドロップアウトカラー帳票を読んでいます。正しく書式定義を行なったはずですが、左右にずれて読み取られます。原因を教えてください。

A14

ドロップアウトカラー帳票の読み取りには、帳票イメージの周囲に8mm程度の黒帯(黒背景)が必要です。 DynaEye proはこの黒背景から用紙の端を検出し、これをもとに読み取り位置を決めます。 黒背景に白抜けがあったり、黒背景に別な黒い図形が近接していた場合、用紙の端を誤検出するため、読み取り位置がずれることがあります。
ずれた読み取り箇所の左右の黒背景が正しく出ているか、帳票のイメージデータをご確認ください。問題が無い場合、書式定義のイメージも確認ください。
用紙の端に大きいノイズが出ている、用紙の端に黒印刷がある場合には用紙端の検出に失敗します。用紙の端から 2.85 mm にはドロップアウトカラー以外の印刷を行なわないようにしてください。 ユーザーズガイドの「9.1 書式定義とは」の項目も参照ください。
黒背景が完全な黒ベタではなく、白抜けが発生している場合にも検出を誤ります。これは以下の原因が考えられます。

  • スキャナの「シャープネス」や「輪郭強調」を標準より大きく設定していると、スキャナ側の画像処理により白抜けが発生します。これらの値は標準でお使いください。
  • スキャナ内部にゴミが付いている可能性がありますので清掃をお願いします。

なおF6316Aイメージリーダでは、上端の黒背景に縦筋状の白抜けが1箇所発生しますが、これは機構上のもので読み取りには支障ありません。


Q15

カタカナ欄で濁点付き文字に誤読することが多いのですが?

A15

濁点付き文字への誤読が多い場合、濁点/半濁点を別枠に、つまり文字枠2つに書いて頂いた方が高い認識率が得られます。 この場合、書式定義のフィールド情報では以下のように字種を設定します。

フィールド情報

カタカナはチェックしないで、字種限定にチェックをし、テキストボックスの中に、゛゜-「」アイウエオカキクケコ...ワヲン (濁点付き文字を除く全部のカタカナ字種を書きます。実際には半角文字により指定します。)を書いてください。 こうすると濁点の付いた文字が認識対象から外れますので、認識精度の向上につながります。


Q16

問題なく運用していましたが、急に、認識できなくなったり、認識率がとても悪くなったりします。どうしてでしょうか?

A16

以下のような原因が考えられますので、ご確認をお願いします。

  • 帳票の印刷を変更していませんか?
    帳票デザインが変わることで、読めなくなる場合があります。
    印刷業者を変えることでインキの色が変わり、ドロップアウトしなくなる場合があります。
  • スキャナが出力する画像が変わっていませんか?
    読み取りパラメータを変えたためにイメージが濃く、あるいは薄くなり、読めなくなる場合があります。
    まれに、スキャナの故障により画像にノイズが増えることがあります。
  • スキャナ機種を変更しましたか?
    機種によりドロップアウトする色が違うため、今までのインキがドロップアウトしなくなる場合があります。

Q17

フリーピッチの住所欄(手書き日本語フィールド)は何行まで読めますか?

A17

手書き日本語フィールドであり、住所知識処理を設定してあり、フリーピッチ(一文字毎に枠が無い欄)の場合のみ、複数行の認識が可能です。 行数の上限が決まっている訳ではありませんが、

  • 一つの住所であること(複数の住所は認識できません)
  • 活字のように行と行とが明確に分かれていること
  • 都道府県や市区郡の途中で改行はできません
  • 文字サイズの制限(200dpiのとき文字高さ7mm以上)

などの仕様から、3行程度までが運用(帳票設計)できる範囲内と思われます。


Q18

フリーピッチの住所欄で、全く違う住所になることがあります。住所知識処理では、郵便番号と住所のどちらが優先されますか?

A18

特にどちらを優先していることはありません。また、住所の結果から郵便番号を置き換える処理はしていません。
住所知識処理の流れとしては、以下となります。

  1. 住所部分の知識処理をおこない、いくつかの候補に絞る。
  2. 郵便番号の認識結果と住所の候補を照らし合わせる。
  3. 郵便番号の認識結果と住所の下位候補が対応していて、評価値が基準を満たす場合のみ、住所の候補を入れ換える。

一文字枠の無いフリーピッチの場合、乱雑に書かれたり、小さな文字を書かれたりする場合があり、住所知識処理を使っても文字認識できない場合があることをご承知おきください。