「Python」カテゴリーアーカイブ

デジタル採点手書きフリーで検索したら、その後の続き

ほんとうは、今回のお話のタイトルは･･･

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能も搭載しました！

･･･にしたかったのですが、すみません。その前に、自動採点を行うための準備ついて、どこのサイトにもあまり書いてないことを、書いておきたいと思います。

これから書くことは、もしかしたら僕が知らなかっただけで、機械学習に携わる方であれば注意・留意事項以前の「常識」と言っていいようなことなのかもしれません。

それでも、万一にでも、僕の経験が、初めて機械学習や自動採点に挑戦される方の参考になれば、それこそ、何よりの幸いです。

追記

機械学習のライブラリは何にするか･･･とか、溢れんばかりに、いや、溢れかえるほどに情報があることではなく、僕は、それ以前の物語（準備作業）の重要性に気づいたのです。思ったような結果が出ないのは、ライブラリが悪いのではなく、学習用データや推論用データの作り方に問題があったのです。

ある規格に揃えられた、ブレないデータで学習し、学習時と同じ規格で生成された、ブレないデータで推論（判定）する。これがさんざんまわり道をしてたどり着いた、僕なりの結論です。機械学習の最重要ポイントは、データの作成にありました。

【もくじ】

１．学習＆推論データについて
２．解答欄の切り出し
３．解答欄からの解答の切り出し
４．学習用データを作る
５．学習モデルを作る
６．まとめ
７．お願いとお断り

１．学習＆推論データについて

機械学習を行うためには、機械に学習させるデータが必要なことは言うまでもありません。数字ならMNIST、日本語のカタカナであれば ETL といったところでしょうか。

２年前、初めて機械学習にチャレンジしたとき、上の２つのデータベースを知り、当時は keras とニューラルネットワークを使ってカタカナ「アイウエオ」の自動採点に挑戦･･･

それなりに時間と、手間暇をかけて自分なりに頑張ったのですが、どうしても夢見たような結果が得られず、最終的には･･･自作のデジタル採点プログラムへの搭載を断念。

そのいちばんの原因は、（今思えば）学習モデル作成以前に、「高品質な学習データを準備できなかった」ことにありました。

例えば、学習データとする文字・数字・記号を縦横 28 ピクセルの画像として用意するとした場合、画僧中の文字・数字・記号の大きさ、位置、濃さ、その他、画像中のシミや汚れ、等々と言った実に様々な要素の影響を考慮し、必要な場合は修正（補正）を施して･･･、

学習モデル作成用に準備した学習用画像の「それ」と

実際の採点に利用する解答用紙の解答欄から切り出した推論用画像の「それ」が

完全に一致するように「学習用」＆「推論用」画像を準備しなければなりません。

場合によっては、推論対象ごとに処理（修正・補正）を変更する必要すら生じます。例えば「１」や「イ」など、その形状が比較的単純な数字・文字は、画像を二値化して処理した方が認識率が高まるのではないかと実験して感じました（あくまでも、僕自身の実験結果からの判断です。ご注意ください。ただ、僕自身は、この目で見た実験の結果を信じて、推論対象とする数字や文字ごとに処理を分けて実装しています）。

２年前の僕は、学習用画像を作成する段階で、解答用紙の『解答欄の切り出し』にはなんとか成功したものの、解答欄の中の『解答そのものの切り出し』に失敗（例えば、同じ「ア」でも、「つ」と「ノ」の組み合わせのように見える「ア」の場合、機械は「ア」ではなく、「つ」と「ノ」のように別々に輪郭検出）してしまい、高品質な学習用画像が作れませんでした。もちろん、同じ理由から、思うような推論用画像も、生成できるわけがなく･･･

様々に試行を繰り返しましたが、結果としては、自作ソフトへの自動採点機能の搭載を断念せざるを得ませんでした。ただ、自分がとった方法では『ダメ』だという事実と、無加工状態の大量の手書きのカタカナ文字「アイウエオ」、数字の「０～９」、記号の「〇と × 」の画像データが残りました。今回の再チャレンジで、これらのデータが役に立ったことは言うまでもありません。もちろん、『ダメだった』という貴重な経験も、今回はその方向に進んではいけないという、良い指標となりました。

まとめると、良い学習モデルを作成するためには、学習モデルを作成するために使用する学習用画像そのものの品質を、高品質化･･･と言うか、学習用画像の作成方法と、推論用画像の作成方法の差異をなくし、縦横 28 ピクセルの画像とする過程で、数字・文字・記号の大きさを揃え、画像中の位置を中心化し、シミや汚れの除去等々、徹底した修正（補正）を行って、機械が学習しやすく、かつ、判定もより確実に行えるよう、推論用の画像データも学習用データと同じ処理を行って作成したものにする等、ヒトの側で、学びやすい環境と推論しやすい環境を整えてあげることが、ライブラリ云々以前に、他のどんな要素よりも重要で大切なことなんだということが（僕がそう思うだけかもしれませんが）自分なりに納得できた、機械学習で使用する学習＆推論用データ作成に関する最終的な結論です。

以下、僕自身が行った画像の切り出しと修正（補正）方法の一部を紹介します。

２．解答欄の切り出し

２年前は、64 ビット環境で作業したのですが、今回は敢えて 32 ビット環境での機械学習にチャレンジすることにしました。理由は、ただひとつ。自分のアプリケーションがいつも利用している組み込み用の Python 環境である Embeddable Python が 32 ビットバージョンであるためです。

利用するライブラリも、２年前の keras ではなく、scikit-learn に変更しました。２年前は、見様見真似で作ったニューラルネットワークを用いましたが、今回は特徴量を抽出する手法（HOG + LBP）を用いて学習モデルを作成し、推論に利用しました。

世の中の流れには、完全に逆行しているような気がしますが、『正しく自動採点できた！』という結果が出せれば、方法は何でも良いと考え、ニューラルネットワークのことは忘れることにしました。

『機械学習』と言えば、即、ニューラルネットワークだと思い込んでいた･･･２年前の僕に、今は･･･、「そんなに短絡的に、思い込まなくても、よかったんじゃないか･･･」って言ってあげたい気もします。

それより、学習用データや、推論用データを、しっかり作ることの方が、大切だよ･･･って。

データが正しければ、ライブラリは間違えない。
データに誤りがあれば、ライブラリも間違える。

ライブラリの性能を、最高に引き出せるデータを作ることが、

機械学習では、きっと･･･

いちばん、大切な、こと･･･なんだよって。

それが、今回のチャレンジを終えて、感じた･･･僕自身の偽りのない、正直な、思いです。

プログラムに自動採点機能を実装するためには、文字を認識し、推論（判定）する処理が必要です。そのため、最初に行わなければならないのが解答用紙画像から解答欄矩形を切り出す処理です。これには次のようなスクリプトを使用しました。

# 解答用紙から解答欄矩形を切り出すスクリプト（AnswerColumnCutter.py）

import cv2
import numpy as np
import os
from glob import glob

# 入出力フォルダ
input_folder = r'.\MyData'  # 解答用紙画像のあるフォルダ
output_folder = r'.\ACData'  # 切り出した解答欄の保存先
os.makedirs(output_folder, exist_ok=True)

# 対象画像の拡張子
image_extensions = ['*.png', '*.jpg', '*.jpeg']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 解答欄サイズの閾値（調整可能）
min_width = 100
min_height = 50
max_width = 800
max_height = 400

# 保存ファイルの連番用カウンタ
save_index = 1

# 処理ループ
for image_path in image_files:
    filename = os.path.basename(image_path)

    # 画像読み込み（日本語ファイル名に対応）
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        print(f'読み込み失敗: {filename}')
        continue

    # グレースケール変換と二値化
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    blur = cv2.GaussianBlur(gray, (5, 5), 0)
    _, binary = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # 輪郭検出（内枠も含める）
    contours, _ = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

    for cnt in contours:
        area = cv2.contourArea(cnt)
        if area < 1000:
            continue

        approx = cv2.approxPolyDP(cnt, 0.02 * cv2.arcLength(cnt, True), True)

        if len(approx) == 4:
            x, y, w, h = cv2.boundingRect(approx)

            if min_width <= w <= max_width and min_height <= h <= max_height:
                roi = image[y:y+h, x:x+w]

                save_name = f'answer_{save_index:04d}.png'
                save_path = os.path.join(output_folder, save_name)
                cv2.imencode('.png', roi)[1].tofile(save_path)

                save_index += 1

print(f'Saving complete! {save_index - 1} items saved.')

実行結果は、次の通りです。数字・文字（記号）は、この記事用にすべて自分で書きました。

これでOKかというと、実はOKではありません。解答用紙の画像から切り出した解答欄の画像１枚１枚をよく見ると･･･

文字の他に、解答欄の矩形の一部が見えます。最終的には輪郭検出で文字の部分のみを見つけて、文字のみを切り出すので影響はないようにも思いますが、より確実に文字を切り出すために不安要素はすべて準備段階で取り除いておくことにしました。

上のスクリプトに、枠線（罫線）を除去する機能を追加します。

# 解答欄矩形の枠線を消す処理を追加したスクリプト（AnswerColumnCutter2.py）

import cv2
import numpy as np
import os
from glob import glob

# 入出力フォルダ
input_folder = r'.\MyData'  # 解答用紙画像のあるフォルダ
output_folder = r'.\ACData'  # 切り出した解答欄の保存先
os.makedirs(output_folder, exist_ok=True)

# 対象画像の拡張子
image_extensions = ['*.png', '*.jpg', '*.jpeg']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 解答欄サイズの閾値（調整可能）
min_width = 100
min_height = 50
max_width = 800
max_height = 400

# ROIの枠線除去用パディング（上下左右のピクセル数）※状況によっては、個別に指定することも可とした
Pad = 10  # 画像の状態に応じて適宜修正する
padding_top = Pad
padding_bottom = Pad
padding_left = Pad
padding_right = Pad

# 保存ファイルの連番用カウンタ
save_index = 1

# 処理ループ
for image_path in image_files:
    filename = os.path.basename(image_path)

    # 画像読み込み（日本語ファイル名対応）
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        print(f'読み込み失敗: {filename}')
        continue

    # グレースケール変換と二値化
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    blur = cv2.GaussianBlur(gray, (5, 5), 0)
    _, binary = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # 輪郭検出（内枠も含める）
    contours, _ = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

    for cnt in contours:
        area = cv2.contourArea(cnt)
        if area < 1000:
            continue

        approx = cv2.approxPolyDP(cnt, 0.02 * cv2.arcLength(cnt, True), True)

        if len(approx) == 4:
            x, y, w, h = cv2.boundingRect(approx)

            if min_width <= w <= max_width and min_height <= h <= max_height:
                roi = image[y:y+h, x:x+w].copy()

                # 枠線を削除（上下左右 padding ピクセルを白で塗りつぶす）
                roi[:padding_top, :] = 255  # 上
                roi[-padding_bottom:, :] = 255  # 下
                roi[:, :padding_left] = 255  # 左
                roi[:, -padding_right:] = 255  # 右

                save_name = f'answer_{save_index:04d}.png'
                save_path = os.path.join(output_folder, save_name)
                cv2.imencode('.png', roi)[1].tofile(save_path)

                save_index += 1

print(f'Saving complete! {save_index - 1} items saved.')

結果は、次の通りです。

では、これで OK かというと、まだ問題があります。問題の１つが画像中の黒や灰色の汚れです。

これらも出来る限り、除去できるよう解答欄の切り出しスクリプトを改良します。

'''
解答欄矩形の枠線を消す処理を追加したスクリプト（AnswerColumnCutter2.py）に
黒点も削除する処理を追加したAnswerColumnCutter3.py
'''

import cv2
import numpy as np
import os
from glob import glob

# 入出力フォルダ
input_folder = r'.\MyData'  # 解答用紙画像のあるフォルダ
output_folder = r'.\ACData'  # 切り出した解答欄の保存先
os.makedirs(output_folder, exist_ok=True)

# 対象画像の拡張子
image_extensions = ['*.png', '*.jpg', '*.jpeg']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 解答欄サイズの閾値（調整可能）
min_width = 100
min_height = 50
max_width = 800
max_height = 400

# ROIの枠線除去用パディング（上下左右のピクセル数）
Pad = 5
padding_top = Pad
padding_bottom = Pad
padding_left = Pad
padding_right = Pad

# 保存ファイルの連番用カウンタ
save_index = 1

# 処理ループ
for image_path in image_files:
    filename = os.path.basename(image_path)

    # 画像読み込み（日本語ファイル名対応）
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        print(f'読み込み失敗: {filename}')
        continue

    # グレースケール変換と二値化（binaryにはblurされた白黒反転画像が入る）
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    blur = cv2.GaussianBlur(gray, (5, 5), 0)
    _, binary = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # 輪郭検出（内枠も含める）
    contours, _ = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

    for cnt in contours:
        area = cv2.contourArea(cnt)
        if area < 1000:
            continue

        approx = cv2.approxPolyDP(cnt, 0.02 * cv2.arcLength(cnt, True), True)

        if len(approx) == 4:
            x, y, w, h = cv2.boundingRect(approx)

            if min_width <= w <= max_width and min_height <= h <= max_height:
                # imageは元のカラー画像（輪郭検出に使用したbinaryではないことに注意する！）
                roi = image[y:y+h, x:x+w].copy()

                # 枠線を削除（上下左右 padding ピクセルを白で塗りつぶす）
                roi[:padding_top, :] = 255  # 上
                roi[-padding_bottom:, :] = 255  # 下
                roi[:, :padding_left] = 255  # 左
                roi[:, -padding_right:] = 255  # 右

                # --- シミやノイズを除去する処理を追加 ---
                gray_roi = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY)

                # 小さな黒点や灰色点を除去（モルフォロジー開演算）
                kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (3, 3))
                opened = cv2.morphologyEx(gray_roi, cv2.MORPH_OPEN, kernel, iterations=1)

                # 小さな輪郭（ノイズ）を除去
                cleaned = opened.copy()
                contours_noise, _ = cv2.findContours(255 - opened, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
                for c in contours_noise:
                    if cv2.contourArea(c) < 150:  # 小さな汚れを消す
                        cv2.drawContours(cleaned, [c], -1, 255, -1)

                # グレースケール→カラーに戻す
                cleaned_color = cv2.cvtColor(cleaned, cv2.COLOR_GRAY2BGR)
                roi = cleaned_color

                # 保存
                save_name = f'answer_{save_index:04d}.png'
                save_path = os.path.join(output_folder, save_name)
                cv2.imencode('.png', roi)[1].tofile(save_path)

                save_index += 1

print(f'Saving complete! {save_index - 1} items saved.')

結果は、次の通り。

しかし、まだ問題が残っています。それは･･･

この灰色の直線のようなものが入る理由がわからないのですが、現実問題として、僕が利用している複合機でスキャンしたJpeg画像には時折り、このような直線が入ってしまいます（もっと黒い線になることもあります）。理由はともあれ、これを除去できるよう、新しくスクリプトを作成しました。解答用紙から切り出して保存した解答欄画像に対して処理を行っていることにご注意ください。

'''
縦線は画像の高さに匹敵する長さ、
横線は画像の幅に匹敵する長さを持つ直線のみを除去するスクリプト。
image.shape を使って幅 (width) と高さ (height) を取得。
縦線: 傾き ≒ 垂直（3度以内）かつ 長さ ≥ 高さの 80%。
横線: 傾き ≒ 水平（3度以内）かつ 長さ ≥ 幅の 80%。
'''

import cv2
import numpy as np
import os
from glob import glob

# 処理対象フォルダ
folder = r'.\ACData'  # 解答欄画像として保存したデータを修正しています
image_extensions = ['*.png', '*.jpg', '*.jpeg']
image_paths = []
for ext in image_extensions:
    image_paths.extend(glob(os.path.join(folder, ext)))

for image_path in image_paths:
    # 日本語ファイル名対応で画像読み込み
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        print(f"読み込み失敗: {image_path}")
        continue

    height, width = image.shape[:2]
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    # エッジ検出（低い閾値で薄い線も対象）
    edges = cv2.Canny(gray, threshold1=20, threshold2=80, apertureSize=3)

    # HoughLinesPで直線検出
    lines = cv2.HoughLinesP(
        edges,
        rho=1,
        theta=np.pi / 180,
        threshold=50,
        minLineLength=30,
        maxLineGap=5
    )

    # 線を描画するマスク
    mask = np.zeros_like(gray)

    if lines is not None:
        for line in lines:
            x1, y1, x2, y2 = line[0]
            dx = x2 - x1
            dy = y2 - y1
            length = np.sqrt(dx ** 2 + dy ** 2)

            # 傾きが垂直に近く、高さに匹敵する長さを持つ線
            if (abs(dx) < 1e-5 or abs(dy / dx) > 20) and length >= height * 0.8:
                cv2.line(mask, (x1, y1), (x2, y2), 255, thickness=2)

            # 傾きが水平に近く、幅に匹敵する長さを持つ線
            elif (abs(dy) < 1e-5 or abs(dx / dy) > 20) and length >= width * 0.8:
                cv2.line(mask, (x1, y1), (x2, y2), 255, thickness=2)

    # マスクされた領域を修復（inpainting）
    if np.count_nonzero(mask) > 0:
        inpainted = cv2.inpaint(image, mask, inpaintRadius=3, flags=cv2.INPAINT_TELEA)
    else:
        inpainted = image  # 線が見つからなければそのまま

    # 上書き保存（日本語ファイル名対応）
    cv2.imencode('.png', inpainted)[1].tofile(image_path)

    print(f'修正完了: {os.path.basename(image_path)}')

print("全ファイルの処理が完了しました。")

結果は、次の通り。

これでようやく安心して使える解答欄の切り出し画像が準備できました！

３．解答欄からの解答の切り出し

次は、解答の切り出しです。２年前はここで失敗しました。今回、あらためて失敗の原因を考えてみると、２年前も輪郭検出までは成功したのですが、輪郭検出できた場合に、『その後の処理をどう行うか？』という部分で（２年前は）工夫が足りなかったことに気づきました。

それはどういうことか、説明します。
まず、輪郭検出です。わかりやすさのために、検出した部分を赤枠で囲って示します。

文字全体が一筆書きのように描かれていれば正しく検出できるのですが、文字を構成する部品が独立して描かれている場合には、文字全体を正しく検出できていません。

今回は、『輪郭検出できた部分を組み合わせて出来る範囲の周囲を文字と見なして切り取る』という方法を用いてみました。次の画像にその結果を示します。

左から順に拡大して見てみます。

拡大すると、文字を構成する部品が完全に繋がっているわけではないようです。が、輪郭検出自体には成功しています。輪郭検出に使用した OpenCV は本当に優秀なライブラリです。

こちらの「ア」は、３つの輪郭の範囲を合わせて文字として認識。切り出しに成功しました！

こちらの「イ」は、２つの輪郭の範囲を合わせて文字として認識。切り出しに成功しました！

では、これで本当に OK かというと、コトはそう簡単ではありませんでした。

次のような、黒点が残ってしまった画像に対し、この切り抜き処理を実行すると･･･

次のように、左隅の黒点部分まで、文字を構成する部品の一部と見なし、（ヒトから見れば）誤った範囲を文字として切り出してしまいます。

機械的には、極めて正確に、ヒトの命令に忠実に、正しい処理を行っているわけですが･･･

この問題に対しては、『検出した輪郭の中から「面積の大きな輪郭」（最大輪郭の面積の10%以上のもの）をすべて組み合わせた領域を文字領域とみなし、その周囲に上下左右10ピクセルの白い余白を付けて切り抜く』方法で対応しました。次がそのスクリプトです。

import cv2
import numpy as np
import os
from glob import glob

# 入出力フォルダのパス（必要に応じて変更）
input_folder = r'.\MyInputFolder'     # ←処理対象フォルダ
output_folder = r'.\Crop04_Pic'       # ←保存先フォルダ
os.makedirs(output_folder, exist_ok=True)

# 画像拡張子に対応
image_extensions = ['*.png', '*.jpg', '*.jpeg']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 処理ループ
for image_path in image_files:
    filename = os.path.basename(image_path)

    # 日本語ファイル名対応の読み込み
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        print(f'読み込めません: {filename}')
        continue

    # グレースケール & 二値化
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    _, binary = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # 縦線除去処理（細い直線ノイズを消す）
    vertical_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (1, 30))  # 縦方向に長いカーネル
    vertical_lines = cv2.morphologyEx(binary, cv2.MORPH_OPEN, vertical_kernel, iterations=1)
    binary_cleaned = cv2.subtract(binary, vertical_lines)

    # 輪郭検出（外側のみ）
    contours, _ = cv2.findContours(binary_cleaned, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    if not contours:
        print(f'輪郭なし: {filename}')
        continue

    # 最大輪郭の面積を基準に、大きな輪郭（最大輪郭の10%以上）を抽出
    max_area = max([cv2.contourArea(c) for c in contours])
    area_threshold = 0.1 * max_area
    large_contours = [c for c in contours if cv2.contourArea(c) >= area_threshold]
    if not large_contours:
        print(f'大きな輪郭なし: {filename}')
        continue

    # 大きな輪郭群の外接矩形の結合領域を求める
    x_vals = []
    y_vals = []
    x2_vals = []
    y2_vals = []
    for cnt in large_contours:
        x, y, w, h = cv2.boundingRect(cnt)
        x_vals.append(x)
        y_vals.append(y)
        x2_vals.append(x + w)
        y2_vals.append(y + h)
    combined_x = min(x_vals)
    combined_y = min(y_vals)
    combined_x2 = max(x2_vals)
    combined_y2 = max(y2_vals)

    # 余白を加える（画像範囲内に収める）
    pad = 10
    x1 = max(combined_x - pad, 0)
    y1 = max(combined_y - pad, 0)
    x2 = min(combined_x2 + pad, image.shape[1])
    y2 = min(combined_y2 + pad, image.shape[0])
    cropped = image[y1:y2, x1:x2]

    # 保存（PNG形式、元のファイル名と同じ名前）
    save_path = os.path.join(output_folder, os.path.splitext(filename)[0] + '.png')
    cv2.imencode('.png', cropped)[1].tofile(save_path)

print(f'Saving complete!')

次のように、構成部品が離れている「ア」であっても（思った通りに）切り出すことに成功しました！

このようにして切り出した画像から、次に機械学習による学習モデルを作るための学習用データを準備します。今回は、scikit-learn の HOG特徴量抽出を利用するので、解答欄から切り出した手書き数字・文字・記号の画像を、手書き数字や単純な記号認識に適しているとされ、MNISTデータセット（手書き数字認識の標準データセット）で採用されているサイズである 28 × 28 ピクセルの画像に変換します。

次に、その変換方法について説明します。

４．学習用データを作る

機械学習の学習用データの作成方法として、僕が行ったことが正しいかどうかは、この記事をお読みになった方ご自身でご判断ください。僕自身は、機械学習を理論的な背景を含め、基礎からきちんと学んだことはありませんし、今回利用した HOG（ Histogram of Oriented Gradients ）＋ LBP（Local Binary Patterns ）という特徴量抽出手法についてもその詳細な部分まで理解しているわけではないからです。そのような点を御理解の上、記事をお読みいただけましら幸いです。

学習用データは、予め、「ア」なら「ア」だけを、正解ラベル名を付けたフォルダに分類しておきます。

これを処理して、次に示すような 28 × 28 ピクセルの画像を作成します。

この 28 × 28 ピクセルの画像を作成する過程で、必要に応じて、補正処理をかけ、機械学習を行うために必要十分と思われる画像となるよう準備します。ここで言う必要十分とは、機械に見せる画像内の推論対象の「大きさ・位置・傾き・濃さ」等をヒト基準で一定の範囲に収まるように、予め個々の画像を学習前・推論前に調整し、学習時も推論時も同じ処理の過程を経て作成された･･･言わば「ブレていない」画像（データ）を機械が見れる＝機械は余計な気遣いなどできないので、同じ条件下で作成された画像を見て、機械は「その特徴量抽出のみに専念できるようにする」という意味です。

繰り返しになりますが、学習用画像を作成する時だけでなく、推論用画像を作成する際も、学習用画像を作成する際に行ったのと同じ処理をそっくりそのまま行って、機械が常に同じ（安定した）条件下で推論（手書き文字の認識作業）を実行できるようにするという部分も非常に重要だと考えます。

処理に使用したライブラリの一覧です。

import cv2
import numpy as np
import os
from glob import glob
import re
import joblib
from skimage.feature import hog, local_binary_pattern

文字を傾きを均一化し、分類器がより正確な特徴を学習できるようにするために次の関数を用意。

def deskew(img):
    m = cv2.moments(img)
    if abs(m["mu02"]) < 1e-2:
        return img.copy()
    skew = m["mu11"] / m["mu02"]
    M = np.float32([[1, skew, -0.5 * 28 * skew], [0, 1, 0]])
    return cv2.warpAffine(img, M, (28, 28), flags=cv2.INTER_NEAREST | cv2.WARP_INVERSE_MAP, borderValue=255)

学習用画像データの読み込み処理部分は割愛します。

次が学習用画像の処理ループ部分です。任意に指定した学習用データを保存したフォルダ内の全画像について処理を以下の通り実行します。補正処理の実行内容は、各々のコメントをご参照ください。

index = 1
light_text_threshold = 215  # 文字の視認性の向上（薄いと判断する閾値）
pad = 10                     # 周囲に設定する余白
clip_limit = 0.3            # コントラストの過剰な増加を防ぐための制限値。ごく弱く設定。
tile_grid_size = 2          # 画像を分割するグリッドのサイズ。ごく小さめに設定

# 学習用データの数だけループする
for image_path in image_files:
    image = imread_utf8(image_path)
    if image is None:
        continue
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    _, binary = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    '''
    小さすぎる or 明るすぎる成分は除外して、画像の連結成分を解析し、有効な成分のみを抽出、
    適切な境界を決めて、その範囲を文字として切り出す処理。
    '''
    num_labels, labels, stats, centroids = cv2.connectedComponentsWithStats(binary, connectivity=8)
    min_area = 50
    brightness_threshold = 200

    valid_components = []
    for i in range(1, num_labels):
        x, y, w, h, area = stats[i]
        if area < min_area:
            roi = gray[y:y+h, x:x+w]
            mean_val = cv2.mean(roi)[0]
            if mean_val > brightness_threshold:
                continue
        valid_components.append((x, y, w, h))

    if not valid_components:
        cropped = np.full((28, 28, 3), 0, dtype=np.uint8)
    else:
        x_vals = [x for x, y, w, h in valid_components]
        y_vals = [y for x, y, w, h in valid_components]
        x2_vals = [x + w for x, y, w, h in valid_components]
        y2_vals = [y + h for x, y, w, h in valid_components]
        combined_x = min(x_vals)
        combined_y = min(y_vals)
        combined_x2 = max(x2_vals)
        combined_y2 = max(y2_vals)

        x1 = max(combined_x - pad, 0)
        y1 = max(combined_y - pad, 0)
        x2 = min(combined_x2 + pad, image.shape[1])
        y2 = min(combined_y2 + pad, image.shape[0])
        cropped = image[y1:y2, x1:x2]

    '''
    明るい文字のコントラストを調整し、認識しやすくする処理。白飛びを防ぎ、画像の視認性を改善する。
    '''
    trimmed_gray = cv2.cvtColor(cropped, cv2.COLOR_BGR2GRAY)
    mask = (trimmed_gray >= light_text_threshold).astype(np.uint8) * 255
    adjusted = trimmed_gray.copy()
    adjusted[mask == 255] = np.clip(adjusted[mask == 255] - 20, 0, 255)

    # 輪郭検出
    contours, _ = cv2.findContours(adjusted, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    if contours:
        # CLAHEを適用
        clahe = cv2.createCLAHE(clipLimit=clip_limit, tileGridSize=(tile_grid_size, tile_grid_size))
        trimmed_gray = clahe.apply(trimmed_gray)
        # 調整した結果、ここではぼかし無しと同等にしておくことにした。必要であればより強く設定。
        trimmed_blur = cv2.GaussianBlur(trimmed_gray, (1, 1), 0)
        # 単純な形であれば二値化して処理する
        if label in ["イ", "1"]:
            _, trimmed_thresh = cv2.threshold(trimmed_blur, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
            h_trim, w_trim = trimmed_thresh.shape[:2]
        else:
            h_trim, w_trim = trimmed_blur.shape[:2]

        scale = 20.0 / max(h_trim, w_trim)
        new_w = int(w_trim * scale)
        new_h = int(h_trim * scale)

        if label in ["イ", "1"]:
            resized = cv2.resize(trimmed_thresh, (new_w, new_h), interpolation=cv2.INTER_AREA)
        else:
            resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_AREA)

        # 学習用データから切り出した文字を28×28ピクセルのキャンバスの中央に配置する。
        # 入力画像を統一されたサイズに整える。
        canvas = np.full((28, 28), 255, dtype=np.uint8)
        x_offset = (28 - new_w) // 2
        y_offset = (28 - new_h) // 2
        canvas[y_offset:y_offset + new_h, x_offset:x_offset + new_w] = resized
        # 文字の傾きを均一化する
        deskewed = deskew(canvas)

        # - 画像のモーメント（統計量） を計算し、文字の重心（中心）を求めてセンタリングする処理
        M = cv2.moments(deskewed)
        if M["m00"] != 0:
            cx = int(M["m10"] / M["m00"])
            cy = int(M["m01"] / M["m00"])
            # 画像を重心基準で移動
            shift_x = 14 - cx
            shift_y = 14 - cy
            trans_mat = np.float32([[1, 0, shift_x], [0, 1, shift_y]])
            deskewed = cv2.warpAffine(deskewed, trans_mat, (28, 28), flags=cv2.INTER_AREA, borderValue=255)

        canvas = deskewed

        # 画像の標準化
        mean, std = cv2.meanStdDev(canvas)
        std = std[0][0] if std[0][0] > 1e-5 else 1.0
        # 画像の正規化
        norm_img = (canvas.astype(np.float32) - mean[0][0]) / std
        norm_img = cv2.normalize(norm_img, None, 0, 255, cv2.NORM_MINMAX)
        canvas = norm_img.astype(np.uint8)
    else:
        # - 有効な画像データがない場合は、白色の 28×28 画像を作成。
        canvas = np.full((28, 28), 255, dtype=np.uint8)

    # png形式で保存する
    save_path = os.path.join(output_folder, f"crop_Img{index:04d}.png")
    is_written = cv2.imencode(".png", canvas)[1]
    with open(save_path, "wb") as f:
        f.write(is_written)
    index += 1

png 形式での保存を選択したことにも理由があります。データを間引いて保存する Jpeg 形式よりも、可逆圧縮を使用し、元の画像データを損失なく保存（ピクセル単位での正確性を維持）できる png 形式の方が機械学習には適しているからです。

こうして、次のような学習用データが完成しました。

こんな小さな画像ですが、ここまで到達するには･･･　本当に長い時間と･･･試行錯誤が必要でした。

５．学習モデルを作る

任意のフォルダ内（ここでは trimed フォルダ）に、正解ラベルの名前を付けたフォルダを必要数分準備して、上の４で作成した学習データを格納しておきます。

そして、学習モデルを作成するスクリプトを実行します。例としてカタカナ「アイウエオ」の推論用の学習用データ作成スクリプトを示します。

import os
import cv2
import numpy as np
import joblib

from skimage.feature import hog, local_binary_pattern
from sklearn.decomposition import IncrementalPCA
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import classification_report

LABELS = {'ア': 0, 'イ': 1, 'ウ': 2, 'エ': 3, 'オ': 4}
IMG_SIZE = (28, 28)

LBP_RADIUS = 1
LBP_POINTS = 8 * LBP_RADIUS
LBP_METHOD = 'uniform'

DATASET_DIR = r".\aiueo\Trimed"

def extract_features(image):
    image = cv2.GaussianBlur(image, (3, 3), 0)
    hog_features = hog(image, pixels_per_cell=(4, 4), cells_per_block=(2, 2), feature_vector=True)
    lbp = local_binary_pattern(image, LBP_POINTS, LBP_RADIUS, method=LBP_METHOD)
    lbp_hist, _ = np.histogram(lbp.ravel(), bins=np.arange(0, LBP_POINTS + 3), range=(0, LBP_POINTS + 2))
    lbp_hist = lbp_hist.astype("float32")
    lbp_hist /= (lbp_hist.sum() + 1e-6)
    return np.concatenate([hog_features, lbp_hist])

def load_dataset_in_batches(root_dir, max_samples_per_label=7000, batch_size=500, show_progress=False):
    label_dirs = [d for d in os.listdir(root_dir) if os.path.isdir(os.path.join(root_dir, d)) and d in LABELS]

    for label_name in label_dirs:
        label_path = os.path.join(root_dir, label_name)
        files = os.listdir(label_path)
        np.random.shuffle(files)
        batch_features = []
        batch_labels = []

        total_files = min(len(files), max_samples_per_label)
        if show_progress:
            print(f"\n[{label_name}] 読み込み開始 (最大{total_files}枚)")

        for i, file in enumerate(files):
            if i >= max_samples_per_label:
                break
            file_path = os.path.join(label_path, file)
            image = cv2.imdecode(np.fromfile(file_path, dtype=np.uint8), cv2.IMREAD_GRAYSCALE)
            if image is None or image.shape != IMG_SIZE:
                continue
            feat = extract_features(image)
            batch_features.append(feat)
            batch_labels.append(LABELS[label_name])

            if show_progress and ((i + 1) % max(1, total_files // 20) == 0 or (i + 1) == total_files):
                progress = (i + 1) / total_files * 100
                print(f"  {i+1}/{total_files}枚完了 ({progress:.1f}%)")

            if len(batch_features) >= batch_size:
                yield np.array(batch_features, dtype=np.float32), np.array(batch_labels, dtype=np.int32)
                batch_features = []
                batch_labels = []

        if batch_features:
            yield np.array(batch_features, dtype=np.float32), np.array(batch_labels, dtype=np.int32)

# 特徴抽出
print("\n[特徴量収集]")
all_features = []
all_labels = []
for batch_features, batch_labels in load_dataset_in_batches(DATASET_DIR, show_progress=True):
    all_features.append(batch_features)
    all_labels.append(batch_labels)

X_all = np.vstack(all_features)
y_all = np.hstack(all_labels)

# PCA学習
print("\n[PCA学習開始]")
n_components = 200
pca = IncrementalPCA(n_components=n_components)
pca.fit(X_all)

# 特徴量変換
X_pca = pca.transform(X_all)

# データ分割
print("\n[データ分割]")
X_train, X_test, y_train, y_test = train_test_split(X_pca, y_all, test_size=0.2, random_state=42)

# 間違えてもとにかく判定
# model = SVC(kernel='rbf', gamma='scale', C=10)
# 指定正解率未満の場合は「判定不可能」と表示
# この指定着きでビルドしていない場合、判定スクリプトを実行すると「handwritten_digit_0.png の推定結果: モデルが確率推定に未対応」と表示される
model = SVC(kernel='rbf', C=10, probability=True)

'''
# ハイパーパラメータ探索 -> 1, 10, 50, 100 の中から探す。結果、C=10 だった！
print("\n[グリッドサーチ]")
param_grid = {'C': [1, 10, 50, 100]}
svc = SVC(kernel='rbf', gamma='scale')
clf = GridSearchCV(svc, param_grid, cv=3)
clf.fit(X_train, y_train)
print(f"最適なCの値: {clf.best_params_['C']}")
model = clf.best_estimator_
'''

# モデル学習（これが抜けているとエラーになる！）
model.fit(X_train, y_train)

# 評価
print("\n[テストデータで評価]")
y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred, target_names=list(LABELS.keys())))

# 確率推定
# y_proba = model.predict_proba(X_test)  # 各クラスの確率を取得
# print(y_proba[:5])  # 最初の5つの予測結果の確率を表示

# モデル保存
print("\n[モデル保存]")
joblib.dump(model, "aiueo_svm_model.pkl")
joblib.dump(pca, "aiueo_pca.pkl")
print("[保存完了]")

実行結果は、次の通りです。

[特徴量収集]
[ア] 読み込み開始 (最大2511枚)
  125/2511枚完了 (5.0%)
　･･･（省略）･･･
  2511/2511枚完了 (100.0%)
[イ] 読み込み開始 (最大2575枚)
  128/2575枚完了 (5.0%)
  ･･･（省略）･･･
  2575/2575枚完了 (100.0%)
[ウ] 読み込み開始 (最大2636枚)
  131/2636枚完了 (5.0%)
  ･･･（省略）･･･
  2636/2636枚完了 (100.0%)
[エ] 読み込み開始 (最大2582枚)
  129/2582枚完了 (5.0%)
  ･･･（省略）･･･
  2582/2582枚完了 (100.0%)

[オ] 読み込み開始 (最大2602枚)
  130/2602枚完了 (5.0%)
  ･･･（省略）･･･
  2602/2602枚完了 (100.0%)
[PCA学習開始]
[データ分割]
[テストデータで評価]
              precision    recall  f1-score   support

           ア       1.00      1.00      1.00       516
           イ       1.00      1.00      1.00       538
           ウ       1.00      1.00      1.00       537
           エ       1.00      1.00      1.00       499
           オ       1.00      1.00      1.00       492

    accuracy                           1.00      2582
   macro avg       1.00      1.00      1.00      2582
weighted avg       1.00      1.00      1.00      2582

上のスクリプトで、

X_train, X_test, y_train, y_test = train_test_split(X_pca, y_all, test_size=0.2, random_state=42)

としていますので、データセットの 80% を学習用 (X_train, y_train)、20% をテスト用 (X_test, y_test) に分割していることになります。

スクリプトを実行する度に、テスト用の20%の内容は変化しますので [テストデータで評価] の部分は変化するはずですが、何回か、実行した結果悪くても 0.99 で、どの文字についても、ほとんど 1.00 から変化がありませんでした。

ちなみに、もう１回実行してみると･･･

[テストデータで評価]
              precision    recall  f1-score   support

           ア       1.00      1.00      1.00       516
           イ       1.00      1.00      1.00       538
           ウ       1.00      1.00      1.00       537
           エ       1.00      1.00      1.00       499
           オ       1.00      1.00      1.00       492

    accuracy                           1.00      2582
   macro avg       1.00      1.00      1.00      2582
weighted avg       1.00      1.00      1.00      2582

もう１回、実行してみました。

[テストデータで評価]
              precision    recall  f1-score   support

           ア       1.00      1.00      1.00       516
           イ       0.99      1.00      1.00       538
           ウ       1.00      1.00      1.00       537
           エ       1.00      1.00      1.00       499
           オ       0.99      0.99      0.99       492

    accuracy                           1.00      2582
   macro avg       1.00      1.00      1.00      2582
weighted avg       1.00      1.00      1.00      2582

「イ」と「オ」が 0.99 ですが、それでも 0.99 です。

・適合率 (precision) がほぼ 1.00 なので、正解ラベルを正しく予測できています。
・再現率 (recall) がほぼ 1.00 なので、実際の正解ラベルを確実に検出できています。
・F1スコアがほぼ 1.00 なので、誤分類はありません。

で、総合精度 (accuracy) が 1.00 ですから、今回、作成した学習モデルはテストデータに対して完璧に近い性能を発揮していると言ってよいと思います。ただ、ただ、過学習に陥ってないことを祈るのみです。過学習に陥っていないことの確認するのは簡単です。未知の手書きカタカナ「アイウエオ」のデータを、この学習モデルに見せて、正しく推論できるか、テストしてあげればよいのです。

なので、未知のカタカナ文字を正しく推論できるか、テストしてみました。

テストに使用したスクリプトです。こちらは簡易版で、実際の場面では、より良い推論用データとなるよう、このスクリプトを適用する前処理として、上で学習用データを作成するために行った補正（修正）を上の５つの画像に対して行い、その後、このテスト用スクリプトを適用することになります。

# アイウエオ判定用最終版

import os
import cv2
import numpy as np
import joblib
from skimage.feature import hog, local_binary_pattern

# 定数
IMG_SIZE = (28, 28)
LBP_RADIUS = 1
LBP_POINTS = 8 * LBP_RADIUS
LBP_METHOD = 'uniform'

# 特徴量抽出関数（前処理スクリプトと整合）
def extract_features(image):
    image = cv2.GaussianBlur(image, (3, 3), 0)

    # HOG特徴量
    hog_features = hog(
        image,
        pixels_per_cell=(4, 4),
        cells_per_block=(2, 2),
        feature_vector=True
    )

    # LBP特徴量（ヒストグラム）
    lbp = local_binary_pattern(image, LBP_POINTS, LBP_RADIUS, method=LBP_METHOD)
    lbp_hist, _ = np.histogram(
        lbp.ravel(),
        bins=np.arange(0, LBP_POINTS + 3),
        range=(0, LBP_POINTS + 2)
    )
    lbp_hist = lbp_hist.astype("float")
    lbp_hist /= (lbp_hist.sum() + 1e-6)

    return np.concatenate([hog_features, lbp_hist])

# モデルとPCA読み込み
model = joblib.load("aiueo_svm_model.pkl")
pca = joblib.load("aiueo_pca.pkl")

# 推論対象ファイル（日本語ファイル名対応）
file_list = [f"katakana_sample_{i+1}.jpg" for i in range(5)]

# 推論実行
for file_name in file_list:
    if not os.path.exists(file_name):
        print(f"ファイルが存在しません: {file_name}")
        continue

    file_path = os.path.abspath(file_name)
    # 日本語パス・ファイル名対応
    image = cv2.imdecode(np.fromfile(file_path, dtype=np.uint8), cv2.IMREAD_GRAYSCALE)

    if image is None:
        print(f"読み込み失敗: {file_name}")
        continue

    # サイズ変換（28x28）と前処理との整合
    image_resized = cv2.resize(image, IMG_SIZE, interpolation=cv2.INTER_AREA)

    # 特徴量 → PCA変換 → SVM予測
    features = extract_features(image_resized)
    features_pca = pca.transform([features])
    prediction = model.predict(features_pca)

    print(f"{file_name} の推定結果: {prediction[0]}")

学習モデル（ aiueo_svm_model.pkl と aiueo_pca.pkl ）は、スクリプトと同じ場所に置いて実行します。結果は、次の通りです。

katakana_sample_1.jpg の推定結果: 0
katakana_sample_2.jpg の推定結果: 1
katakana_sample_3.jpg の推定結果: 2
katakana_sample_4.jpg の推定結果: 3
katakana_sample_5.jpg の推定結果: 4

よかった･･･。過学習には陥っていないようです。

あとは･･･ Delphi の P4D（ Python4Delphi ）を使って、僕の手書き答案採点補助プログラム AC_Reader で、このスクリプトを実行すれば･･･

自動採点を、実現できます。

６．まとめ

機械学習で良い学習モデルを作るには、学習用データ作りをしっかり行うことが大切。文字の大きさ・位置（配置）・濃さ等の調節、及び、画像中の不要な点（シミ）や汚れを除去する等々して、個々にブレのない安定した学習用データ（もちろん、推論用データも同様）を作成、これを元に学習モデルを作成すれば上に示した結果を出せるはずです。

今回の記事で紹介した内容は、テストを繰り返し行って、問題点を洗い出し、それら問題点を１つ１つ丁寧に解決した結果です。絶対に『あきらめない』こと、もしかしたら、それがいちばん重要で大切なポイントかもしれません。

７．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容（プログラムを含む）を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

デジタル採点手書きフリーで検索したら、その後

前回の記事を書いてから、scikit-learn を使った機械学習による手書きカタカナ文字「ア・イ・ウ・エ・オ」及び記号「○・×」の認識用学習モデル作成について、さらに勉強しました☆

今回は、その記録と、今後の抱負です。

【もくじ】

１．さらに勉強した理由
２．HOGを知る
３．気分は「写経」
４．今後の抱負
５．まとめ
６．お願いとお断り

１．さらに勉強した理由

なぜ、さらに勉強したかというと、前回の記事では、画像のピクセル値をそのまま利用する Flattening という特徴量抽出の手法を用いて学習モデルを作成したのですが、前回の記事にある通り、既知の（＝学習に利用した）カタカナ文字については、アイウエオ各文字ともに 98 ％正しく判定できたという好結果に力を得て、Delphi で GUI を作成した手書き答案の採点補助プログラムから、Python の文字認識スクリプトを実行できるよう、新しくプログラムを書いて実験してみた結果、期待に反して１回も見たことのない新規の文字については、正しく判定できないことがありました。特に「オ」は全滅･･･

以下、かるーくやってみた実験の結果です。

「ア」はふたつとも読めた･･･

記入位置の探索も、上手く行えてるようです･･･

ふたつめの「ウ」の方が、典型的な「ウ」により近い？気がするけど･･･

「エ」は得意なのかな･･･

この「オ」の認識結果を見て、正直、これはダメだと思いました。また、失敗です。T_T

ちなみに「○・×」は･･･

なにか書いてあれば･･･「○」だと思ってる･･･
（空欄を識別しているのは、うれしい限りですが）

「○ or ×」認識テストの結果は、「オ」の場合よりさらにダメです。まぁ上の「オ」の場合の「ア」についても確信を持って見分けて「×」を付けているのか、どうか、この結果を見てだいぶ怪しくなってきました。（果たして、あの「オ」や「ア」をどう読んだのか･･･、それを確認する気力も失せました･･･）

さらに、お見せしたくないのが、「×」が正解ラベルの場合です。

THE END.
その想いで胸がいっぱいに！

実装が超シンプルで、かつ高速で軽量、文字画像のピクセル値（28×28）をそのまま利用する Flattening という手法では、これが限界なのでしょうか？

学習用データをさらに増やせば、もっと良い結果が得られるのではないか･･･とも考えましたが、手元にその学習用データがありません。新規に学習用データを集めるには莫大な手間と時間が必要です。

ただ･･･失敗の中でも唯一救いに感じたのは、２年前の文字認識チャレンジでどうしてもクリア出来なかった解答欄中の文字が書かれている位置を正しく認識することに成功し、意図した通りに文字画像を取得出来ていることです。

プログラムはその記入位置を正確に見つけ出し、28×28の矩形画像への切り出しに成功しています。

実は、この Blog の過去の記事で「失敗の記録」として掲載した手書き文字認識チャレンジの試行錯誤の記事を書いた当時、文字の認識に失敗した最大の原因は「正しく文字を切り出せなかった」ことにありました。今回、テストしたのは、たった３枚の画像ですが、いずれも問題なく文字が記入されている位置をプログラムは特定し、その正確な切り出しに成功しています。

切り出した画像の縦横比が、元の画像と変化していることに、画像を見て気づきました！
ここは出来れば改善したいところです。

２年前の僕の技術では、例えば「ア」について、文字を構成する線がすべて繋がっている場合は「ア」という文字１文字だと正しく認識できても、「つ」部分と「ノ」部分が離れている場合は、「ア」ではなく「つ」と「ノ」に分解して認識してしまうミスをどうしても防げなかったのです。今回のチャレンジでは、この問題を無事クリアできました。

２年前の僕の技術では、３つめの「ア」は「つ」と「ノ」になってしまいましたが･･･

今回のプログラムは、ちゃんと「ア」として切り出しています。
ただ、やはり縦横比が･･･気になりますので、ここは何とかします！

さらに、解答欄から切り出した文字の位置が切り出し画像の中央にあることも、長い間ずっと･･･この胸に思い描いた夢の通りです。

文字の縦横比は変わっていますが、文字位置の特定には何の問題もなく、成功しています☆
さらに、解答欄左にある（５）のような解答欄の番号を無視することにも成功しています☆☆
２年前にどうしてもクリア出来なかった複数の問題を、今回はすべてクリア出来ました☆☆☆

総合的な意味では今回も失敗でしたが、自分にとって、前回、クリア出来なかった幾つもの問題を解決できたことは、本当に大きな前進でした。だから、総合的には失敗でも、☆５つが完全な成功だとしたら、自分的には ☆☆☆ です。

また、今回、Flattening による学習モデル作成方法を学ぶことで、Python に 32 ビット環境の scikit-learn ライブラリを導入する手法を完全に理解できました。機械学習そのものが現在 64 ビット環境へ移行しつつある中で、32 ビット環境の最後の輝きを、今、僕は目の当たりにしている･･･そんな気がしてなりませんでした。

２．HOGを知る

Flattening の欠点に気づいたのは、Python 環境で作成した学習モデルを Delphi の Object Pascal から操作できるようにプログラミングを終えた段階（上の画像は、その段階での試行の様子）だったので、･･･結果的に Delphi 側の最も重要なプログラムを最初から組み直すことにはなりましたが･･･ここで僕は、エッジや輪郭の方向に強く、ノイズの影響も受けにくい HOG（Histogram of Oriented Gradients）という特徴量を抽出する手法があることを知ります。HOG を勉強してみたところ、こちらの手法の方が画像のピクセル値のそのまま利用する Flattening より、文字の識別精度が高いのではないかと思えてきました。

そこで HOG を用いて文字の特徴量を抽出して学習モデルを作成するスクリプトを書きました。最初に、ごく基本的なコードを書き、そこに必要な様々な処理を追加して行く方法で一歩一歩確実に進んだ結果、文字の認識能力が Flattening 特徴量抽出手法を使ったそれよりは高いのではないか？と、確かに思える学習モデルを作成することができました。HOG 特徴量抽出手法を使った学習モデルは、Delphi に組み込む前に、Python スクリプトを使って行った試行で、上の「オ」を２つともサラっと認識してくれたのです！

試行の様子がこちらです。

解答用紙から切り出した解答欄の矩形画像

さらに解答欄の中の文字部分を探索して、切り抜いて･･･

解答欄から切り出した28×28ピクセルの矩形画像
（新しいプログラムではファイル名のIndexは１始まりにしました）

Delphi に埋め込む前に、Python 用のスクリプトで読んでみます･･･

やった！　ちゃんと読めた！！　「オ」だけじゃなく「ア」も正しく読めています！！！

以下、HOG特徴量抽出手法を適用した学習モデル作成に必要な、学習用の文字データを作成するために使用したスクリプトです（使用を推奨するものではありません。あくまでもご参考まで）。

このスクリプトは、輪郭検出と文字切り出し、周囲パディングを均一化して、文字を画像の中心に配置、GaussianBlurによるノイズ除去、傾き補正、28×28ピクセルに正規化して保存･･･と言った機能を備えています。万一、コピペして試される場合は PATH をご自身の環境に合わせて変更してください。

import cv2
import numpy as np
import os
from glob import glob
import re

# UTF-8 パス対応の画像読み込み
def imread_utf8(path):
    stream = np.fromfile(path, dtype=np.uint8)
    return cv2.imdecode(stream, cv2.IMREAD_COLOR)

# 傾き補正（修正: warpAffine に補間法と白背景を明示）
def deskew(img):
    m = cv2.moments(img)
    if abs(m['mu02']) < 1e-2:
        return img.copy()
    skew = m['mu11'] / m['mu02']
    M = np.float32([[1, skew, -0.5 * 28 * skew], [0, 1, 0]])
    return cv2.warpAffine(img, M, (28, 28), flags=cv2.INTER_NEAREST | cv2.WARP_INVERSE_MAP, borderValue=255)

# ファイル名から数値を抽出（img12.png → 12）
def extract_number(path):
    filename = os.path.basename(path)
    match = re.search(r'img(\d+)', filename)
    return int(match.group(1)) if match else float("inf")

# 入力・出力フォルダ（パスに全角文字が含まれていてもOK）
input_folder = r"C:\Python39-32\Images_tegaki\aiueo\ア"
output_folder = os.path.join(input_folder, "Trimed")
os.makedirs(output_folder, exist_ok=True)

# 対象画像拡張子
image_extensions = ['*.jpg', '*.jpeg', '*.png']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 並べ替え（img番号順）
image_files.sort(key=extract_number)

index = 1
for image_path in image_files:
    image = imread_utf8(image_path)
    if image is None:
        print(f"読み込めない画像: {image_path}")
        continue

    h, w = image.shape[:2]
    gray_for_line = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    edges = cv2.Canny(gray_for_line, 50, 150, apertureSize=3)

    raw_lines = cv2.HoughLinesP(edges, 1, np.pi / 180, threshold=100,
                                minLineLength=min(w, h) // 3, maxLineGap=10)
    filtered_lines = []
    if raw_lines is not None:
        for line in raw_lines:
            x1, y1, x2, y2 = line[0]
            angle = abs(np.arctan2(y2 - y1, x2 - x1) * 180 / np.pi)
            length = np.hypot(x2 - x1, y2 - y1)
            if (angle < 10 or angle > 170) and length < w // 2:
                continue
            filtered_lines.append([[x1, y1, x2, y2]])

    if filtered_lines:
        for line in filtered_lines:
            x1, y1, x2, y2 = line[0]
            if abs(x2 - x1) < 10 or abs(y2 - y1) < 10:
                cv2.line(image, (x1, y1), (x2, y2), (255, 255, 255), thickness=3)

    if w > h:
        offset = w // 4
        cropped = image[:, offset:w - offset]
    else:
        offset = h // 4
        cropped = image[offset:h - offset, :]

    gray = cv2.cvtColor(cropped, cv2.COLOR_BGR2GRAY)
    _, thresh = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY_INV)

    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (10, 10))
    dilated = cv2.dilate(thresh, kernel, iterations=1)
    contours, _ = cv2.findContours(dilated, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    if contours:
        all_points = np.vstack(contours)
        x, y, w_box, h_box = cv2.boundingRect(all_points)
        padding = 20  # この値は、切り抜き画像を確認しつつ、適宜調整してください。
        if w > h:
            x += offset
        else:
            y += offset

        x1 = max(0, x - padding)
        y1 = max(0, y - padding)
        x2 = min(w, x + w_box + padding)
        y2 = min(h, y + h_box + padding)

        trimmed = image[y1:y2, x1:x2]
        trimmed_gray = cv2.cvtColor(trimmed, cv2.COLOR_BGR2GRAY)
        trimmed_blur = cv2.GaussianBlur(trimmed_gray, (3, 3), 0)

        h_trim, w_trim = trimmed_blur.shape[:2]
        scale = 20.0 / max(h_trim, w_trim)
        new_w = int(w_trim * scale)
        new_h = int(h_trim * scale)
        # resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_AREA)
        resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_NEAREST)

        canvas = np.full((28, 28), 255, dtype=np.uint8)
        x_offset = (28 - new_w) // 2
        y_offset = (28 - new_h) // 2
        canvas[y_offset:y_offset + new_h, x_offset:x_offset + new_w] = resized        

        deskewed = deskew(canvas)

        # モーメントで中心を合わせる（修正: warpAffine に補間法と白背景を明示）
        M = cv2.moments(deskewed)
        if M['m00'] != 0:
            cx = int(M['m10'] / M['m00'])
            cy = int(M['m01'] / M['m00'])
            shift_x = 14 - cx
            shift_y = 14 - cy
            trans_mat = np.float32([[1, 0, shift_x], [0, 1, shift_y]])
            deskewed = cv2.warpAffine(deskewed, trans_mat, (28, 28), flags=cv2.INTER_NEAREST, borderValue=255)

        canvas = deskewed
    else:
        print(f"文字が検出されませんでした: {os.path.basename(image_path)}")
        canvas = np.full((28, 28), 255, dtype=np.uint8)

    # 保存（全角パスにも対応）
    save_path = os.path.join(output_folder, f"{index:04d}.png")
    is_success, encoded_img = cv2.imencode('.png', canvas)
    if is_success:
        encoded_img.tofile(save_path)
        print(f"{save_path} を保存しました。")
    else:
        print(f"{save_path} の保存に失敗しました。")

    index += 1

print("すべての画像の処理が完了しました。")

上のスクリプトで 28×28 ピクセルに整形して保存した大量の学習用データ画像を、次のスクリプトで処理して学習モデルを生成します。こちらについても、万一、コピペして試される場合は PATH をご自身の環境に合わせて変更してください（こちらも使用を推奨するものではありません。あくまでもご参考まで）。

import cv2
import numpy as np
from sklearn import svm
from sklearn.model_selection import train_test_split
import os
import joblib  # モデルの保存と読み込みに使用
from skimage.feature import hog
from sklearn.svm import SVC

# カタカナのクラス
CATEGORIES = ["ア", "イ", "ウ", "エ", "オ"]

# Pathの中の日本語に対応
def imread(filename, flags=cv2.IMREAD_GRAYSCALE, dtype=np.uint8):
    try:
        n = np.fromfile(filename, dtype)
        img = cv2.imdecode(n, flags)
        return img
    except Exception as e:
        print(e)
        return None

# HOG特徴量を抽出する関数
def extract_hog_features(img):
    # 画像はすでに28x28の想定
    features = hog(img,
                   orientations=9,
                   pixels_per_cell=(4, 4),
                   cells_per_block=(2, 2),
                   block_norm='L2-Hys')
    return features

# データセットの準備（28x28 の手書きカタカナ画像）
def load_images_from_folder(folder, categories):
    images = []
    labels = []
    for label, category in enumerate(categories):
        path = os.path.join(folder, category)
        print(f"Processing category: {category}, Path: {path}")

        if not os.path.exists(path):
            print(f"Warning: Path does not exist: {path}")
            continue

        for file in os.listdir(path):
            if file.lower().endswith(('.png', '.jpg', '.jpeg')):
                file_path = os.path.join(path, file)
                try:
                    img = imread(file_path)
                    if img is not None:
                        img = cv2.resize(img, (28, 28))
                        hog_features = extract_hog_features(img)
                        images.append(hog_features)
                        labels.append(label)
                    else:
                        print(f"Failed to load image: {file_path}")
                except Exception as e:
                    print(f"Error loading {file_path}: {e}")
            else:
                print(f"Skipping non-image file: {file}")
    print(f"Loaded {len(images)} images")
    return np.array(images), np.array(labels)

# データ読み込み
X, y = load_images_from_folder(r"C:\Python39-32\Images_tegaki\aiueo\Trimed", CATEGORIES)

if len(X) == 0:
    raise ValueError("No images loaded. Please check the image files and paths.")

# 学習とテストの分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# SVM モデルの作成と学習
model = svm.SVC(kernel='linear')
model.fit(X_train, y_train)

# モデルを保存する
joblib.dump(model, 'katakana_hog_svm_model.pkl')
print("Model saved as 'katakana_hog_svm_model.pkl'")

# 予測用前処理（HOG版）
def preprocess_image(image_path):
    img = imread(image_path)
    h, w = img.shape

    size = max(h, w)
    square_img = np.full((size, size), 255, dtype=np.uint8)
    x_offset = (size - w) // 2
    y_offset = (size - h) // 2
    square_img[y_offset:y_offset + h, x_offset:x_offset + w] = img

    img_resized = cv2.resize(square_img, (28, 28))
    hog_features = extract_hog_features(img_resized)
    return hog_features

def predict_character(image_path):
    img = preprocess_image(image_path)
    model = joblib.load('katakana_hog_svm_model.pkl')
    label = model.predict([img])[0]
    return CATEGORIES[label]

# テスト画像の認識（テスト用の画像は実行中のスクリプトと同じフォルダに用意・保存する）
for image_path in [
    "katakana_sample_a.jpg",
    "katakana_sample_i.jpg",
    "katakana_sample_u.jpg",
    "katakana_sample_e.jpg",
    "katakana_sample_o.jpg"
]:
    result = predict_character(image_path)
    print(f"{os.path.basename(image_path)} の認識結果: {result}")

テストに使用した画像は、次の通りです。文字の太さはテスト用に変化のあるものを選びました。

上記、学習モデルを作成するスクリプトの実行結果です。

３．気分は「写経」

次は、完成した学習モデルをDelphiから使えるようにすれば OK なのですが、この作業は毎回「写経」を行っているような気持ちを感じる作業です。･･･と、言う僕自身、写経の経験は皆無ですが･･･この業界で一般的に使用される「写経」的意味合いと、ここでのそれは異なり、感覚的にはむしろ「修行」に近いものです。

次のコードを見ていただければ、なぜ「修行」なのか、ご理解いただけると思います。

procedure TFormCollaboration.btnAutoClick(Sender: TObject);
var
  strScrList:TStringList;
  strAnsList:TStringList;
  j:integer;
  intCols:integer;
  results: TArray<string>;
  s: string;
begin
  // ･･･ 略 ･･･
  try

    //Scriptを入れるStringList
    strScrList:=TStringList.Create;

    //手書き文字の認識結果
    strAnsList:=TStringList.Create;

    try

      strScrList.Add('import cv2');
      strScrList.Add('import numpy as np');
      strScrList.Add('import os');
      strScrList.Add('from glob import glob');
      strScrList.Add('import re');
      strScrList.Add('from skimage.feature import hog');
      strScrList.Add('import joblib');

      //カタカナラベル
      if (cmbAL.Text = 'ア') or (cmbAL.Text = 'イ') or (cmbAL.Text = 'ウ') or (cmbAL.Text = 'エ') or (cmbAL.Text = 'オ') then
      begin
        strScrList.Add('CATEGORIES = ["ア", "イ", "ウ", "エ", "オ"]');
      end;

      //○×ラベル
      if (cmbAL.Text = '○') or (cmbAL.Text = '×') then
      begin
        strScrList.Add('CATEGORIES = ["○", "×"]');
      end;

      //HOG特徴量抽出
      strScrList.Add('def extract_hog_features(img):');
      strScrList.Add('    features = hog(img, orientations=9, pixels_per_cell=(4, 4), cells_per_block=(2, 2), block_norm="L2-Hys")');
      strScrList.Add('    return features');

      //UTF-8 パス対応の画像読み込み
      strScrList.Add('def imread_utf8(path):');
      strScrList.Add('    stream = np.fromfile(path, dtype=np.uint8)');
      strScrList.Add('    return cv2.imdecode(stream, cv2.IMREAD_COLOR)');

      //傾き補正
      strScrList.Add('def deskew(img):');
      strScrList.Add('    m = cv2.moments(img)');
      strScrList.Add('    if abs(m["mu02"]) < 1e-2:');
      strScrList.Add('        return img.copy()');
      strScrList.Add('    skew = m["mu11"] / m["mu02"]');
      strScrList.Add('    M = np.float32([[1, skew, -0.5 * 28 * skew], [0, 1, 0]])');
      strScrList.Add('    return cv2.warpAffine(img, M, (28, 28), flags=cv2.WARP_INVERSE_MAP, borderValue=255)');

      //ファイル名から数値を抽出（crop_Img12.png → 12）
      strScrList.Add('def extract_number(path):');
      strScrList.Add('    filename = os.path.basename(path)');
      strScrList.Add('    match = re.search(r"crop_Img(\d+)", filename)');
      strScrList.Add('    return int(match.group(1)) if match else float("inf")');

      //文字認識処理
      strScrList.Add('def predict_character(img, model):');
      strScrList.Add('    hog_features = extract_hog_features(img)');
      strScrList.Add('    label = model.predict([hog_features])[0]');
      strScrList.Add('    return CATEGORIES[label]');

      //モデル読み込み
      //カタカナラベル
      if (cmbAL.Text = 'ア') or (cmbAL.Text = 'イ') or (cmbAL.Text = 'ウ') or (cmbAL.Text = 'エ') or (cmbAL.Text = 'オ') then
      begin
        strScrList.Add('model_path = r".\Python39-32\katakana_hog_svm_model.pkl"');
      end;

      //○×ラベル
      if (cmbAL.Text = '○') or (cmbAL.Text = '×') then
      begin
        strScrList.Add('model_path = r".\Python39-32\mb_hog_svm_model.pkl"');
      end;

      strScrList.Add('if not os.path.exists(model_path):');
      strScrList.Add('    raise FileNotFoundError(f"モデルファイルが見つかりません: {model_path}")');
      strScrList.Add('model = joblib.load(model_path)');

      //入力・出力フォルダ
      //strScrList.Add('base_path = r".\imgAuto\src"');
      strScrList.Add('input_folder = r".\imgAuto\src"');
      //strScrList.Add('folder_path = os.path.join(base_path, CORRECT_LABEL)');
      strScrList.Add('output_folder = os.path.join(input_folder, "'+ cmbAL.Text +'")');
      strScrList.Add('os.makedirs(output_folder, exist_ok=True)');

      //対象画像を取得
      strScrList.Add('image_extensions = ["*.jpg", "*.jpeg", "*.png"]');
      strScrList.Add('image_files = []');
      strScrList.Add('for ext in image_extensions:');
      strScrList.Add('    image_files.extend(glob(os.path.join(input_folder, ext)))');
      strScrList.Add('image_files.sort(key=extract_number)');

      strScrList.Add('results = []');

      strScrList.Add('index = 1');
      strScrList.Add('for image_path in image_files:');
      strScrList.Add('    image = imread_utf8(image_path)');
      strScrList.Add('    if image is None:');
      strScrList.Add('        print(f"読み込めない画像: {image_path}")');
      strScrList.Add('        continue');

      strScrList.Add('    h, w = image.shape[:2]');
      strScrList.Add('    gray_for_line = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)');
      strScrList.Add('    edges = cv2.Canny(gray_for_line, 50, 150, apertureSize=3)');

      strScrList.Add('    raw_lines = cv2.HoughLinesP(edges, 1, np.pi / 180, threshold=100, minLineLength=min(w, h) // 3, maxLineGap=10)');
      strScrList.Add('    filtered_lines = []');
      strScrList.Add('    if raw_lines is not None:');
      strScrList.Add('        for line in raw_lines:');
      strScrList.Add('            x1, y1, x2, y2 = line[0]');
      strScrList.Add('            angle = abs(np.arctan2(y2 - y1, x2 - x1) * 180 / np.pi)');
      strScrList.Add('            length = np.hypot(x2 - x1, y2 - y1)');
      strScrList.Add('            if (angle < 10 or angle > 170) and length < w // 2:');
      strScrList.Add('                continue');
      strScrList.Add('            filtered_lines.append([[x1, y1, x2, y2]])');

      strScrList.Add('    if filtered_lines:');
      strScrList.Add('        for line in filtered_lines:');
      strScrList.Add('            x1, y1, x2, y2 = line[0]');
      strScrList.Add('            if abs(x2 - x1) < 10 or abs(y2 - y1) < 10:');
      strScrList.Add('                cv2.line(image, (x1, y1), (x2, y2), (255, 255, 255), thickness=3)');

      strScrList.Add('    if w > h:');
      strScrList.Add('        offset = w // 4');
      strScrList.Add('        cropped = image[:, offset:w - offset]');
      strScrList.Add('    else:');
      strScrList.Add('        offset = h // 4');
      strScrList.Add('        cropped = image[offset:h - offset, :]');

      strScrList.Add('    gray = cv2.cvtColor(cropped, cv2.COLOR_BGR2GRAY)');
      strScrList.Add('    _, thresh = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY_INV)');

      strScrList.Add('    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (10, 10))');
      strScrList.Add('    dilated = cv2.dilate(thresh, kernel, iterations=1)');
      strScrList.Add('    contours, _ = cv2.findContours(dilated, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)');

      strScrList.Add('    if contours:');
      strScrList.Add('        all_points = np.vstack(contours)');
      strScrList.Add('        x, y, w_box, h_box = cv2.boundingRect(all_points)');

      //strScrList.Add('        padding = 20');
      strScrList.Add('        padding = 5');
      strScrList.Add('        if w > h:');
      strScrList.Add('            x += offset');
      strScrList.Add('        else:');
      strScrList.Add('            y += offset');

      strScrList.Add('        x1 = max(0, x - padding)');
      strScrList.Add('        y1 = max(0, y - padding)');
      strScrList.Add('        x2 = min(w, x + w_box + padding)');
      strScrList.Add('        y2 = min(h, y + h_box + padding)');

      strScrList.Add('        trimmed = image[y1:y2, x1:x2]');
      strScrList.Add('        trimmed_gray = cv2.cvtColor(trimmed, cv2.COLOR_BGR2GRAY)');
      strScrList.Add('        trimmed_blur = cv2.GaussianBlur(trimmed_gray, (3, 3), 0)');

      strScrList.Add('        h_trim, w_trim = trimmed_blur.shape[:2]');
      strScrList.Add('        scale = 20.0 / max(h_trim, w_trim)');
      strScrList.Add('        new_w = int(w_trim * scale)');
      strScrList.Add('        new_h = int(h_trim * scale)');
      strScrList.Add('        resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_AREA)');

      strScrList.Add('        canvas = np.full((28, 28), 255, dtype=np.uint8)');
      strScrList.Add('        x_offset = (28 - new_w) // 2');
      strScrList.Add('        y_offset = (28 - new_h) // 2');
      strScrList.Add('        canvas[y_offset:y_offset + new_h, x_offset:x_offset + new_w] = resized');

      strScrList.Add('        deskewed = deskew(canvas)');

      strScrList.Add('        M = cv2.moments(deskewed)');
      strScrList.Add('        if M["m00"] != 0:');
      strScrList.Add('            cx = int(M["m10"] / M["m00"])');
      strScrList.Add('            cy = int(M["m01"] / M["m00"])');
      strScrList.Add('            shift_x = 14 - cx');
      strScrList.Add('            shift_y = 14 - cy');
      strScrList.Add('            trans_mat = np.float32([[1, 0, shift_x], [0, 1, shift_y]])');
      strScrList.Add('            deskewed = cv2.warpAffine(deskewed, trans_mat, (28, 28), borderValue=255)');

      strScrList.Add('        canvas = deskewed');
      strScrList.Add('        predicted_char = predict_character(canvas, model)');
      strScrList.Add('        results.append(str(predicted_char))');
      strScrList.Add('    else:');
      strScrList.Add('        results.append("")');
      strScrList.Add('        canvas = np.full((28, 28), 255, dtype=np.uint8)');

      strScrList.Add('    save_path = os.path.join(output_folder, f"{index:04d}.png")');
      strScrList.Add('    is_success, encoded_img = cv2.imencode(".png", canvas)');
      strScrList.Add('    if is_success:');
      strScrList.Add('        encoded_img.tofile(save_path)');
      strScrList.Add('    index += 1');

      strScrList.Add('var1.Value = ";".join(results)');

      try
        PythonEngine1.ExecStrings(strScrList);
      except
        on E: Exception do
        begin
          ShowMessage('Pythonスクリプトの実行中にエラーが発生しました: ' + E.Message);
          Exit;
        end;
      end;

      strAnsList.Clear;

      if Assigned(PythonDelphiVar1) then
      begin
        s := PythonDelphiVar1.ValueAsString;
        if s <> '' then
        begin
          results := SplitString(s, ';');
          for s in results do
            strAnsList.Add(s);
        end else begin
          ShowMessage('sは空欄！');
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
      end;

      if Assigned(PythonDelphiVar1) then
      begin
        for j := 0 to strAnsList.Count - 1 do
        begin
          if cmbAL.Text = strAnsList[j] then
            StringGrid1.Cells[intCols,j+1] := cmbRendo.Text
          else
            StringGrid1.Cells[intCols,j+1] := '0';
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
        Exit;
      end;

    finally
      //StringListの解放
      strScrList.Free;
      strAnsList.Free;
    end;

    // ･･･ 略 ･･･
end;

エンエンと続く strScrList.Add( ) そう！ここに Python のスクリプトの１行１行をコピペして行くのです。20 行目くらいから、だんだん、まぶたが重くなり･･･、50 行目まで到達する頃には、意識が朦朧としてきて･･･、残り数行という段階で、~~ほぼ涅槃の境地~~に･･･

「涅槃」とは、「一切の煩悩から解脱した、不生不滅の高い境地」であり、「煩悩の火が消え、人間が持っている本能から解放され、心の安らぎを得た状態のこと」をいうのだそうです。

･･･

失礼しました。間違えました。僕のは単に眠くなり、もう何も考えられない状態になっただけです。

何はともあれ、いずれにしてもそのいちばん心が「無」になった状態で、最大の難関が待ち受けています。それは何かというと、Python 側から Delphi 側への判定結果の受け渡しの手続きの記述です。

元々の Python 側でのスクリプトは･･･

        predicted_char = predict_character(canvas, model)
        print(f"{os.path.basename(image_path)} → 認識結果: {predicted_char}")
    else:
        print(f"{os.path.basename(image_path)} → 文字が検出されませんでした。")

ここを、次のように書き換えます。※ results リストは予め空になるよう初期化しておきます。

      strScrList.Add('        predicted_char = predict_character(canvas, model)');
      strScrList.Add('        results.append(str(predicted_char))');
      strScrList.Add('    else:');
      strScrList.Add('        results.append("")');

最後に Delphi 側へ、プレゼント☆

      strScrList.Add('var1.Value = ";".join(results)');

で、Delphi 側では、results に保存されている認識結果を StringList で受け取って、StringGrid に得点を表示します。

      strAnsList.Clear;

      if Assigned(PythonDelphiVar1) then
      begin
        s := PythonDelphiVar1.ValueAsString;
        if s <> '' then
        begin
          results := SplitString(s, ';');
          for s in results do
            strAnsList.Add(s);
        end else begin
          ShowMessage('sは空欄！');
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
      end;

      if Assigned(PythonDelphiVar1) then
      begin
        for j := 0 to strAnsList.Count - 1 do
        begin
          if cmbAL.Text = strAnsList[j] then
            StringGrid1.Cells[intCols,j+1] := cmbRendo.Text  //得点を指定
          else
            StringGrid1.Cells[intCols,j+1] := '0';
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
        Exit;
      end;

もちろん、PATH も、exe のある階層が起点となるように修正して･･･

      //入力・出力フォルダ (cmbAL = ComboBox Answer Label)
      strScrList.Add('input_folder = r".\imgAuto\src"');
      strScrList.Add('output_folder = os.path.join(input_folder, "'+ cmbAL.Text +'")');
      strScrList.Add('os.makedirs(output_folder, exist_ok=True)');

こうして、なんとか、エラーを出さずに、プログラムが「動く」状態にまで仕上げました。

追記_20250421

ふと思ったのですが、Form に非表示の TMemo を１つおいて、そこに Python のスクリプトをコピペして、必要な部分のみ上記のように変更すれば、

もっとラクできたかな･･･

みたいな気が。

でも、「修行」には「修行」で、また、

別の意味と価値がある

ような･･･気も。

ただ、このプログラムの･･･究極の目的は、採点者が単に「ラクする」ためだけの･･･採点環境を実現することにある･･･という事実。

いや、それは「ヒトと機械との美しき協働」の穿った見方。

こんな相反する「矛盾」を、感じるのは作者である僕だけ？

まぁ、全部をまとめて言えば･･･

人生は必ず ± ０になる
ということでしょうか？

なお、Python4Delphi の設定と使い方の詳細は、次の過去記事をご参照ください。

How to use Python4Delphi

早速、冒頭に紹介したのと同じデータを読んで、動作確認。

Delphiへのスクリプト移植前に試行していたので、
あまりドキドキせずに「自動」ボタンをクリックすることができました！

ボタンの Caption は「自動」より、「実行」の方がよかったかな･･･？

気になっていた切り出し画像の縦横比も･･･

縦横比が変化しないようにスクリプトを修正できました！

前回は、正しく読めなかった「ウ」も、この通り読めています。

長かった･･･けれど、ここまで来ることができました☆
あきらめなくて、よかった･･･

イイ感じというか、エエ感じというか･･･

そして、Flattening 特徴量抽出で作成した学習モデルでは読めなかった「オ」･･･ですが、

HOG特徴量抽出で作成した学習モデルは、しっかり読んでくれました！

もちろん、「○・×」判定も･･･余裕でOK！
（何が余裕なのかは、僕自身、わかってないですが）

最初に正解ラベル「○」の場合、

自分的には、HOGで作った学習モデルへの「信頼感」みたいなモノが生まれてきました☆

次に、正解ラベル「×」の場合、

これなら販売できそうです。
まぁ買ってくれる人は、
いないと思いますが･･･ *(^_^)*♪

４．今後の抱負

テストとは、とても言えないような、ほんとうに取り急ぎの採点試行結果ですので、これだけを持って公開してOK！とは、とても思えません。実際の採点現場で性能を確認できたら、自作のデジタル採点ソフト AC_Reader のバージョンアップ版として、この blog の未来記事で公開したいと思います。

５．まとめ

手書き文字認識に scikit-learn を使って成功するためには･･･

（１）特徴量抽出前の学習データ作成を丁寧に行い、機械学習しやすい環境を整える。
（２）学習データが同じである場合、Flattening より HOG 特徴量抽出の方が良い結果を出せた。
（３）誤りがあれば必ず修正し、成功するまで、絶対にあきらめないこと。

６．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容（プログラムコードを含む）を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

デジタル採点　手書き　フリー　で検索したら

久しぶりに、上のキーワードで Google 検索して、びっくりしました。
なんと！検索結果の･･･いちばん上に！･･･僕のプログラムが、表示されてる･･･

(⊙_⊙)

正直。うれしいより先に

やばい！

・・・と、思いました。

（何ページ目くらいに表示されるのかなー☆ ）

本当に、それが、これまでに何度も、何回も繰り返した、僕の blog を Google 検索する時の想い。

（誰か、見てくれないかなー。読んでもらえたら、うれしいなー☆ ）

だから、３ページ目くらいに記事があると、「うん。うん。」って、安心してた･･･。

blog を書くこと自体が、自分の存在確認の行為に他ならないのだけれど･･･

これは本当に思い上がりとか、謙遜とか、そのどちらでもなく･･･

普通に考えて･･･

僕の blog とプログラムが
Google の検索結果で
トップに表示されるわけがない。

どう考えても、それが僕のいる世界の「本当」･･･のはず、なのに･･･
突然！目の前に表示された「画面」という現実を、それでもなお、信じられない気持ちで、眺めつつ。

夢なら覚めないでほしい

そう思ったのも、また、事実です。

この２年間の日々は、色々な意味で、ほんとうに、本当に、苦しかった･･･。

人の立場の違いは、その評価をも、真逆に変える。

あの日、拍手で歓迎されたプログラムが、ただのゴミ以下になる･･･

僕は、そのほんとうを･･･確かに、この目で、見ました。

失意のどん底にある僕を支えてくださった多くの方々に、心から感謝申し上げます。

だから、Google 先生の、僕の blog とプログラムへの評価は、世の中が僕の夢を応援してくれている証明のように思えて、「やばい」と思ったのは本当ですが、やはり、とても、うれしかったのです。

で、問題は「やばい」と感じた理由･･･そう、今回の記事を書くきっかけです。

２年前、同僚の要請に応えるかたちで、手書き答案をスキャンして得た画像から個々の解答欄画像を切り出して一括採点し、採点記号その他を付加して元の画像に書き戻すデジタル採点プログラムの最初のバージョンを書き、「表形式」の解答欄を読み取って処理するので「Answer Column Reader = AC_Reader」と名付けたのですが･･･

その時点で、プロの書いたデジタル採点システムにあって、僕のプログラムにないもの･･･

そう「○・×」、「ア・イ・ウ・エ・オ」、「A・B・C」、「１・２・３」みたいな記号・文字または数字１字の解答であれば自動採点できる機能を僕のプログラムにも搭載したいと、僕はごく自然な流れで考えたのです。

当時、年末・年始の休暇を含めて、ほぼ２か月間、手書き文字の認識に没頭した記憶があります。

その記録は当 blog の過去記事にある通りです。

Get first character from string in image

Recognize handwritten katakana characters

Recognize handwritten katakana characters No,2

Recognize handwritten katakana characters No,3

Recognize handwritten katakana characters No,4

いずれも、他人様の実験結果を、ただ真似しただけの、読むに値しない記事ですが･･･

生成 AI なんてまだなかったあの頃･･･（知らないところで、それは･･･ほぼ出来上がりつつあったのだろうけれど･･･。そう、考えると同時期にレベルの差はあれど、まったく同じ研究をやったと言うことで、たまらなく誇らしいような、いや、それはただの偶然の一致で･･･一方は AI というカタチで見事にモノになり、僕のは無駄な努力で終わり･･･もし、プログラムが当時のまま、今後進化しないのであれば･･･みたいな複雑な気持ちではありますが）、いずれにしても、その時、僕は Google 先生を頼りに『機械学習の真似事』を行い、右も、左も、わからないまま、結局 keras や Lobe のお近づきになれたよーな･･･なれなかったよーな･･･

日々を過ごしたことだけは、事実。（ 2022年、春）

で、結論だけ言うと、お遊び程度に使える自動採点機能を搭載したプログラムが書けました。･･･ただ、書けたことは書けたのですが、使用したライブラリが TensorFlow で、これには 32 ビット版がなく、仕方がないからプログラムは無理して 64 ビット化して作成。

その結果、 AC_Reader に同梱して使うその他のプログラム（ My マークシートリーダー = MS_Reader.exe 等）が 32 ビット版であること、つまり、内部で共通に呼び出して使っている Embeddable Python も 32 ビット版であることから、 AC_Reader と My マークシートリーダーとが共存するには Embeddable Python を共用しなければならないというところが大問題に。結局、64 ビット版の AC_Reader は使用を断念。版を 32 ビットに戻すと同時に、64 ビット版の AC_Reader に搭載した自動採点機能は、32 ビット版で泣く泣く削除。

あれから２年間。AC_Reader は、ほぼ、放置状態。

（表計算ソフトを使わずに、成績一覧表を出力できるようにする等、採点に伴う作業を軽減できるよう、付属的なプログラムを新たに作成すると言った、おまけ的な面で多少の改善は加えましたが、手書き答案の採点という、本業面での進化は、よく使う機能を集めてフローティングパネル化した程度）

そう、せっかく Google 先生が評価してくれたのに、プログラム本体が２年間まったく進化していないことが、心から「やばい」と感じた理由なのです。

苦しかった、この２年間を、その理由にしてはいけないのですが･･･

それでも、僕を支えてくださった方々の要望には、何としても応えたいという思いがあり･･･

必死の思いで、過去記事「組み合わせ採点を実現したい！」に書いた内容を組み込んだ答案返却用答案（？）を作成・印刷する新しいプログラムを書き、採点現場での実地テストを無事終え、そちらを「ReportCard_2025」として公開すべく、準備を進めていたのですが、先に書いた検索結果を目の当たりにして、こちらをいったん中止。

AC_Reader を２年ぶりに進化させることに決めました。
内容はもちろん、自動採点機能の搭載です。

【もくじ】

１．32ビット版で自動採点機能を搭載できないか？
２．Tesseract-OCR を使う
３．scikit_learnを使う
　(1) Embeddable Python へのインストール
　(2) 学習モデルを作成して認識テスト
４．とんでもない認識結果に驚愕する
５．まとめ
６．お願いとお断り

１．32ビット版で自動採点機能を搭載できないか？

Delphi もバージョン 12.3 では「 RAD Studio 12 ( 64-bit Initial Release ) 」がついに登場。機械学習の現場でも 64 ビット化はさらに加速しつつあり、今更、32 ビットにこだわる必要などないと自分でも思うし、64ビット化の流れに反対する気持ちなどまったくないのですが･･･

ただ、これまでに書いてきたプログラムをすべて64ビット化するのは大変だし、その前に、32 ビット版に今すぐできる改良があるなら、それを行えば、より良いものをユーザーに提供できる可能性が 32 ビット版のプログラムにも、まだ残されている気がして･･･

「より良いもの」･･･それこそが 32 ビット版 AC_Reader への自動採点機能の搭載だと思いました。

あれから２年経過して、手書き文字認識や機械学習のプログラム自体も相当進化しているのではないかと考え、まず、思い出したのは Tesseract-OCR です。

２．Tesseract-OCR を使う

他にも思い出せるモノはたくさんあったんだけど、機械学習系は手書き文字の認識の前に、大量のデータを集めてトレーニングして･･･といった学習（の手間）が必要なので、そういった手間のいらないところから搭載の可否を探ろうと思ったわけです。「寄らば大樹の陰･･･」みたいな。

手書き文字でない、既存の TrueType 日本語フォントに対してなら、Tesseract-OCR がどれほど素晴らしい性能を発揮するか、それは２年前に目の当たりにしています。ただ、残念ながら、手書き文字の認識といった部分では、２年前はお世辞にも良好とは言えなかったと記憶しています。

早速、最新版（？）をダウンロード（ tesseract-ocr-w32-setup-v5.3.0.20221214.exe ：これより新しい 32 bit版は探せなかった）して、実験してみました。日付が、ちょっと古いのが気になりましたが。もしかして、２年前もコレで実験した？みたいな感が･･･。

手書き文字は、次のような実験用サンプルを700個（すべて「ア」の画像）ほど用意。

実験に使った Python スクリプトは、コレ！
画像から抽出する文字は「アイウエオ」の中の１字。画像が「ア」であると判定すれば「ア」を出力、「アイウエオ」のいずれでもない（＝判定不能である）場合は「N」を出力する。

import cv2
import pytesseract
import re
import os

# Tesseract-OCRのパス設定
pytesseract.pytesseract.tesseract_cmd = r"C:\Python39-32\Tesseract-OCR\tesseract.exe"

def preprocess_image(image_path):
    """ 画像を前処理してOCRに適した状態にする """
    # グレースケール化
    image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
    # 二値化  
    _, binary = cv2.threshold(image, 128, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)  
    return binary

def extract_katakana(image):
    """ OCRでカタカナを認識する """
    custom_oem_psm = "--oem 3 --psm 10 -l jpn"
    text = pytesseract.image_to_string(image, config=custom_oem_psm)

    # カタカナ1文字のみを抽出
    # match = re.search(r'[アイウエオ]', text)
    return match.group(0) if match else "N"

def process_images_in_folder(folder_path):
    """ 指定フォルダ内のすべての画像を処理 """
    image_extensions = (".png", ".jpg", ".jpeg", ".bmp", ".tif", ".tiff")
    for filename in os.listdir(folder_path):
        # 画像ファイルのみ処理
        if filename.lower().endswith(image_extensions):  
            image_path = os.path.join(folder_path, filename)
            processed_image = preprocess_image(image_path)
            result = extract_katakana(processed_image)
            print(f"{filename}: OCR結果 -> {result}")

if __name__ == "__main__":
    # 画像が入っているフォルダのパス
    folder_path = "Images_Tegaki\img1_a"  
    process_images_in_folder(folder_path)

結果は次の通り。

画像は、全部カタカナの「ア」なんだけどなー。
「N」はともかく、なんで「イ」があるのかなー？

全体の集計では･･･

正解率は 23.3 ％･･･

ただ、「ウ・エ・オ」はありませんでした。そこで･･･

match = re.search(r'[ア]', text)

「ア」１文字で勝負してみました。結果はまったく同じでありました！

よくよく考えれば、同じ文字認識アルゴリズムで「ア」を判定しているのですから、これは当然です。

64 bit バージョンの方は最新版が「最近の日付」でしたから、これより良い結果が得られる可能性があるような気がしますが、僕が使いたい 32 bit バージョンに限っての話をしていますので、この時点で手書き文字の認識に Tesseract-OCR の 32 bit バージョンを使用するか、否か、という問題は、はっきり「否」と答えが出ました。

過去の記事にも書きましたが、これは「手書き文字の認識（それも「ア」１文字）」に限った話であり、他のカタカナ文字については実験もしておりませんし、これを持って、Tesseract-OCR 32 bit バージョンの総合的な「手書き文字」を認識する性能を否定する意図はまったくありません。

日本語 TrueType フォントの書体であれば、Tesseract-OCR は十分実用的な精度で文書をテキスト化してくれる素晴らしいプログラムです！！

３．scikit_learnを使う

(1) Embeddable Python へのインストール

次に思い出したのが keras だったのですが、２年前の実験における手書きカタカナ文字「アイウエオ」の認識率は 95 ～ 97 ％程度（文字によって差がある）で、これ以上はどう頑張ってもダメだった記憶が同時に蘇り･･･

AI に聞いてみると、「 keras も進化してます！」とのことでしたが、ここで、ふと、思い立ち、

「 32 bit で動作するプログラムで、手書き文字認識が可能な Python で動作するオープンソースの機械学習ライブラリは何？」と尋ねてみると･･･

scikit-learn です！

･･･との答えがトップに表示されました。

（ scikit-learn ･･･）

scikit-learn は２年前にも試していません。名前は聴いたことがあったような気がしますが･･･

AI の説明には、心揺さぶられるような文言が並び！！！

曰く、軽量で依存が少ない。
曰く、古いマシンでも動作しやすい。

さらに･･･

「SVM（サポートベクターマシン）などでの文字認識は、軽量で精度も悪くないです。」

とのこと。

サポートベクターマシンってのが、よくわからなかったので、さらに質問して見ると･･･

「サポートベクターマシン（SVM：Support Vector Machine）」は、分類や回帰に使える機械学習のアルゴリズムの一種で、scikit-learn が得意なことは、「はっきりと分けられる2つのクラス分類」であるとのこと。まさに「手書き文字認識」のためにあるようなライブラリ。何で２年前、scikit-learn を試さなかったのか･･･。後悔先に立たず。試さなかった事実は事実。それは認めるしかありません。でも、今、僕は、まだ、生きていて、あの頃は読めなかった AI のアドバイスを、今、読んでる･･･

「他のライブラリにほぼ依存せず、古いPCでも動き、軽量で、精度も悪くない。」

だんだん、だんだん、生成 AI の言うことを信じて、動かしてみたい気になってきました☆

※ ちなみに「回帰」もわからなかったので調べて見ると、「回帰（Regression）」は、予測したい結果が “数値” のときに使う機械学習の手法であるとのこと。「分類（Classification）とセットでよく出てくる」言葉なんだそうです。確かに、どこかで何度も目にしたことがあるような･･･。今、僕がやりたいのは「分類（Classification）」の方ですが、大変、勉強になりました！！

とりあえず、scikit-learn を入手して、それをインストールしなければ話は始まらない。

scikit-learn をインストールする予定の Embeddable Python を入れた Python39-32 フォルダをデジタル採点関係のプログラムを保存しているフォルダから、C:¥へコピーする。

ちなみに Python39-32 の 39 は Python のバージョン、32 は 32 bit 版という意味です。

なんでそんなことをしたかというと、Pathを短くするため。Python関連のプログラムをいじる時は、コマンドプロンプトで作業するのでPathが出来るだけ短い方が作業しやすいのです。

そうしておいて、AI の力を借りて、scikit-learn の 32 bit 版を探します。（実際にはここでかなりの時間を loss しているのですが）その結果わかったことは「通常の pip install scikit-learn でのインストールは 32ビット環境では失敗することが多い」ということ。なので、より確実にインストール可能なWindows用ホイールファイル（＝拡張子が whl のファイル）を探すことにしました。

【参考】Windows用ホイールファイル（.whl）
Pythonで使用されるパッケージ形式のひとつ。Pythonのライブラリやモジュールを効率的にインストールできるファイルで、次の特徴がある。

・事前にビルドされたパッケージなので、必要なコードや依存関係がすべて含まれている。
・ソースコードをビルドする必要がないため、Windows 環境でのインストールが簡単になる。
・pip でインストールできる。
 例: pip install scikit_learn-0.24.2-cp39-cp39-win32.whl

予想通り、世の中は 64 bit 版へ移行しつつあり、scikit-learn の 32 bit 版の最新版は「2021年4月28日」の日付がある「scikit_learn-0.24.2-cp39-cp39-win32.whl」のようです（違うかもしれません）。

以下、実際に僕が行ったインストール作業の様子です。

cp39 だから Python3.9.X に対応しており、win32 だから 32 bit 対応版であることがわかります。検索したらいちばん上に「 Pypl 」の「 scikit-learn 0.24.2 」が表示されました。リンクをたどって、https://pypi.org/project/scikit-learn/0.24.2/ へ行き、さらにページの左側にある「ファイルをダウンロード」をクリックしてダウンロードページへ行き、Built Distributions の上から２番目に目的の「scikit_learn-0.24.2-cp39-cp39-win32.whl」を発見。これをダウンロードして、Python39-32 フォルダへコピー。

コマンドプロンプトを起動していちばん最初に行うことは、この場合、pip のアップデートです。Embeddable Python に Numpy や OpenCV をインストールした時、Embeddable Python で pip を使う方法の詳細なメモを残しておいたので、それを見ながら作業を進めます。

C:\>cd Python39-32

C:\Python39-32>python -m pip install --upgrade pip
Requirement already satisfied: pip in c:\python39-32\lib\site-packages (22.3.1)
Collecting pip
  Using cached pip-25.0.1-py3-none-any.whl (1.8 MB)
Installing collected packages: pip
  Attempting uninstall: pip
    Found existing installation: pip 22.3.1
    Uninstalling pip-22.3.1:
      Successfully uninstalled pip-22.3.1
  WARNING: The scripts pip.exe, pip3.9.exe and pip3.exe are installed in 'C:\Python39-32\Scripts' which is not on PATH.
  Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.
Successfully installed pip-25.0.1

僕のはもう設定してあるから、次の作業は不要だけれど、必要な方がいるかもしれないので参考までに書くと･･･まずは、Embeddable Python で pip を使えるようにする方法。

デフォルトの python.exe では import site が無効になっているため、外部ライブラリをインポートできない。

解決策: python._pth を編集する
    python._pth（python.exe と同じフォルダにある）を開く
    #import site のコメントアウトを解除（# を削除）

# python36.zip
# ./DLLs
# ./Lib
# ./Lib/site-packages
import site  # ← コメントアウトを外す
# Uncomment to run site.main() automatically

さらに、pip を有効化するために次の作業も行う。

pip は Embeddable Python には入っていないので、次の方法で pip を使えるようにする。

(1) get-pip.py をダウンロード
    get-pip.py を 公式サイト（https://bootstrap.pypa.io/get-pip.py）からダウンロード
    C:\Python39-32（僕の場合） に配置

(2) pip をインストール
C:\Python39-32\python.exe get-pip.py

(3) pip でライブラリをインストール
C:\Python39-32\python.exe -m pip install requests

あと、環境変数を設定するには･･･

set PYTHONHOME=C:\Python39-32
set PYTHONPATH=C:\Python39-32\Lib
C:\Python-Embed\python.exe XXX.py  # <-Pythonスクリプトの実行

ここまで行えば、pip が使えるので、ダウンロードした scikit_learn-0.24.2-cp39-cp39-win32.whl のインストールが可能になる。

後で Python スクリプトも実行するので、環境変数の設定も行いつつ･･･

C:\Python39-32>set PYTHONHOME=C:\Python39-32
C:\Python39-32>set PYTHONPATH=C:\Python39-32\Lib
C:\Python39-32>set PYTHONPATH=C:\Python39-32\Scripts  # <-効いてない気がするが･･･

ただ、ここでいきなり scikit_learn をインストールしようとすると失敗します。

C:\Python39-32>python.exe -m pip install C:\Python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Processing c:\python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Requirement already satisfied: numpy>=1.13.3 in c:\python39-32\lib\site-packages (from scikit-learn==0.24.2) (1.21.5)
Collecting scipy>=0.19.1 (from scikit-learn==0.24.2)
  Using cached scipy-1.13.1.tar.gz (57.2 MB)
  Installing build dependencies ... done
  Getting requirements to build wheel ... done
ERROR: Exception:
Traceback (most recent call last):
  File "C:\Python39-32\lib\site-packages\pip\_internal\cli\base_command.py", line 106, in _run_wrapper
    status = _inner_run()
  File "C:\Python39-32\lib\site-packages\pip\_internal\cli\base_command.py", line 97, in _inner_run
    return self.run(options, args)
  File "C:\Python39-32\lib\site-packages\pip\_internal\cli\req_command.py", line 67, in wrapper
    return func(self, options, args)
  File "C:\Python39-32\lib\site-packages\pip\_internal\commands\install.py", line 386, in run
    requirement_set = resolver.resolve(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\resolver.py", line 95, in resolve
    result = self._result = resolver.resolve(
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 546, in resolve
    state = resolution.resolve(requirements, max_rounds=max_rounds)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 427, in resolve
    failure_causes = self._attempt_to_pin_criterion(name)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 239, in _attempt_to_pin_criterion
    criteria = self._get_updated_criteria(candidate)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 230, in _get_updated_criteria
    self._add_to_criteria(criteria, requirement, parent=candidate)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 173, in _add_to_criteria
    if not criterion.candidates:
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\structs.py", line 156, in __bool__
    return bool(self._sequence)
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\found_candidates.py", line 174, in __bool__
    return any(self)
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\found_candidates.py", line 162, in <genexpr>
    return (c for c in iterator if id(c) not in self._incompatible_ids)
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\found_candidates.py", line 53, in _iter_built
    candidate = func()
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\factory.py", line 187, in _make_candidate_from_link
    base: Optional[BaseCandidate] = self._make_base_candidate_from_link(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\factory.py", line 233, in _make_base_candidate_from_link
    self._link_candidate_cache[link] = LinkCandidate(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 304, in __init__
    super().__init__(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 159, in __init__
    self.dist = self._prepare()
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 236, in _prepare
    dist = self._prepare_distribution()
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 315, in _prepare_distribution
    return preparer.prepare_linked_requirement(self._ireq, parallel_builds=True)
  File "C:\Python39-32\lib\site-packages\pip\_internal\operations\prepare.py", line 527, in prepare_linked_requirement
    return self._prepare_linked_requirement(req, parallel_builds)
  File "C:\Python39-32\lib\site-packages\pip\_internal\operations\prepare.py", line 642, in _prepare_linked_requirement
    dist = _get_prepared_distribution(
  File "C:\Python39-32\lib\site-packages\pip\_internal\operations\prepare.py", line 72, in _get_prepared_distribution
    abstract_dist.prepare_distribution_metadata(
  File "C:\Python39-32\lib\site-packages\pip\_internal\distributions\sdist.py", line 56, in prepare_distribution_metadata
    self._install_build_reqs(finder)
  File "C:\Python39-32\lib\site-packages\pip\_internal\distributions\sdist.py", line 126, in _install_build_reqs
    build_reqs = self._get_build_requires_wheel()
  File "C:\Python39-32\lib\site-packages\pip\_internal\distributions\sdist.py", line 103, in _get_build_requires_wheel
    return backend.get_requires_for_build_wheel()
  File "C:\Python39-32\lib\site-packages\pip\_internal\utils\misc.py", line 702, in get_requires_for_build_wheel
    return super().get_requires_for_build_wheel(config_settings=cs)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\pyproject_hooks\_impl.py", line 196, in get_requires_for_build_wheel
    return self._call_hook(
  File "C:\Python39-32\lib\site-packages\pip\_vendor\pyproject_hooks\_impl.py", line 402, in _call_hook
    raise BackendUnavailable(
pip._vendor.pyproject_hooks._impl.BackendUnavailable: Cannot import 'mesonpy'

最初にコレを見たときはマジ泣きたくなりました･･･ T_T

いろいろ調べて見ると、どうやら最後に出てくる MesonPy に原因があるらしいことがわかりました。と、言うのは、scikit_learn と同時にインストールされる scipy には mesonpy というビルドツールが必要で、それが 32ビット環境では動作しないことがエラーの原因とのこと。どうやら MesonPy は 32 bit 版に対応していないようです。じゃあ、どうするかと言うと、最初に scipy を単体でインストールします。

次のサイトにアクセスし、Python 3.9 (32bit) 対応の scipy の .whl をダウンロードします。

https://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy

上のサイトに「scipy-1.9.0-cp39-cp39-win32.whl」があったので、これをダウンロードして、Python39-32 フォルダへコピー。で、pip を使ってインストールします。

C:\Python39-32>python.exe -m pip install C:\Python39-32\scipy-1.9.0-cp39-cp39-win32.whl
Processing c:\python39-32\scipy-1.9.0-cp39-cp39-win32.whl
Requirement already satisfied: numpy<1.25.0,>=1.18.5 in c:\python39-32\lib\site-packages (from scipy==1.9.0) (1.21.5)
Installing collected packages: scipy
Successfully installed scipy-1.9.0

次に scikit_learn をインストール。

C:\Python39-32>python.exe -m pip install C:\Python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Processing c:\python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Requirement already satisfied: numpy>=1.13.3 in c:\python39-32\lib\site-packages (from scikit-learn==0.24.2) (1.21.5)
Requirement already satisfied: scipy>=0.19.1 in c:\python39-32\lib\site-packages (from scikit-learn==0.24.2) (1.9.0)
Collecting joblib>=0.11 (from scikit-learn==0.24.2)
  Downloading joblib-1.4.2-py3-none-any.whl.metadata (5.4 kB)
Collecting threadpoolctl>=2.0.0 (from scikit-learn==0.24.2)
  Downloading threadpoolctl-3.6.0-py3-none-any.whl.metadata (13 kB)
Downloading joblib-1.4.2-py3-none-any.whl (301 kB)
Downloading threadpoolctl-3.6.0-py3-none-any.whl (18 kB)
Installing collected packages: threadpoolctl, joblib, scikit-learn
Successfully installed joblib-1.4.2 scikit-learn-0.24.2 threadpoolctl-3.6.0

ちょっとたいへんだったけど、これでなんとか、scikit_learn の 32 bit 版が Embeddable Python にインストールできました！！（ Python39-32 フォルダのサイズが 335 MB になっちゃったけど、これだけはもうどうにもならない。ちなみに Tesseract-OCR を入れた場合は、その倍くらいになりました！）

(2) 学習モデルを作成して認識テスト

２年前の手書きカタカナ文字認識チャレンジで使った手書きカタカナ文字の画像ファイルは、壊れたノートパソコンから取り外した SSD を専用ケースに入れて作った外付け SSD ドライブに保存してあります。

その SSD ドライブ内を検索し、テストで使えそうな画像ファイルを探すと、ア・イ・ウ・エ・オの各文字がほぼ 700 字ずつ、フォルダに分類されて保存されているのを見つけることができました。

（あった。コレだ ☆ ）

記憶では「水増し」して 3000 文字くらいずつ集めたフォルダもあったはずですが、文字数が増えれば増えるほどコピーに時間がかかります。それに、いきなり 3000 文字を機械学習させて結果が失敗だったら、その後、打つ手がなくなってしまう･･･。だから、とりあえず、この 700 字でテストしてみようと考えました。

２年前は手書きカタカナ文字の収集や整理に膨大な時間を要しましたが、今回は「それがない」から、何の苦労もなく仕事はスイスイ進みます。

scikit_learn の学習モデルを作成するスクリプトに合うよう、画像ファイルを入れたフォルダを準備して学習モデルを作成しました。そのスクリプトがコレです。

import cv2
import numpy as np
from sklearn import svm
from sklearn.model_selection import train_test_split
import os
import joblib  # モデルの保存と読み込みに使用

from sklearn.svm import SVC  # SVMにクラスの重みを追加することで、少数派クラスに対して重みを高く設定

# カタカナのクラス（修正: 「ア」を追加）
CATEGORIES = ["ア", "イ", "ウ", "エ", "オ"]

# Pathの中の日本語に対応
def imread(filename, flags=cv2.IMREAD_GRAYSCALE, dtype=np.uint8):
    try:
        n = np.fromfile(filename, dtype)
        img = cv2.imdecode(n, flags)
        return img
    except Exception as e:
        print(e)
        return None

# データセットの準備（28x28 の手書きカタカナ画像）
def load_images_from_folder(folder, categories):
    images = []
    labels = []
    for label, category in enumerate(categories):
        path = os.path.join(folder, category)  # パスの結合方法を修正
        print(f"Processing category: {category}, Path: {path}")  # デバッグ用に出力

        # ディレクトリが存在するか確認
        if not os.path.exists(path):
            print(f"Warning: Path does not exist: {path}")
            continue

        for file in os.listdir(path):
            # ファイルが画像であるかどうかを拡張子でチェック
            if file.lower().endswith(('.png', '.jpg', '.jpeg')):
                file_path = os.path.join(path, file)
                # print(f"Trying to load file: {file_path}")  # 読み込みファイルのパスを表示
                try:
                    # カタカナを含むパスが問題ないかを確認
                    # img = cv2.imread(file_path, cv2.IMREAD_GRAYSCALE)
                    img = imread(file_path)
                    if img is not None:
                        img = cv2.resize(img, (28, 28))
                        images.append(img.flatten())  # 1次元化
                        labels.append(label)
                    else:
                        print(f"Failed to load image: {file_path}")
                except Exception as e:
                    print(f"Error loading {file_path}: {e}")
            else:
                print(f"Skipping non-image file: {file}")
    print(f"Loaded {len(images)} images")
    return np.array(images), np.array(labels)

# データ読み込み
X, y = load_images_from_folder(r"C:\Python39-32\Images_tegaki\img_28", CATEGORIES)
X = X / 255.0  # 正規化

# データがロードされていない場合にエラーを出す
if len(X) == 0:
    raise ValueError("No images loaded. Please check the image files and paths.")

# 学習とテストの分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# SVM モデルの作成と学習
model = svm.SVC(kernel='linear')
model.fit(X_train, y_train)

# SVM モデルの作成と学習（クラスの重みを設定する）
# class_weights = {0: 1, 1: 2, 2: 2, 3: 1, 4: 1}  # イとウの重みを増やす
# model = SVC(kernel='linear', class_weight=class_weights)
# model.fit(X_train, y_train)

# モデルを保存する
joblib.dump(model, 'katakana_svm_model.pkl')
print("Model saved as 'katakana_svm_model.pkl'")

# 予測関数
def preprocess_image(image_path):
    img = imread(image_path)
    h, w = img.shape

    # 正方形になるように余白を追加
    size = max(h, w)
    square_img = np.full((size, size), 255, dtype=np.uint8)  # 背景を白に
    x_offset = (size - w) // 2
    y_offset = (size - h) // 2
    square_img[y_offset:y_offset + h, x_offset:x_offset + w] = img

    # 28x28 にリサイズ
    img_resized = cv2.resize(square_img, (28, 28))
    return img_resized.flatten() / 255.0

def predict_character(image_path):
    img = preprocess_image(image_path)
    model = joblib.load('katakana_svm_model.pkl')  # 学習したモデルをロード
    label = model.predict([img])[0]
    return CATEGORIES[label]

# テスト画像の認識ア
image_path = "katakana_sample_A.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識イ
image_path = "katakana_sample_I.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識ウ
image_path = "katakana_sample_U.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識エ
image_path = "katakana_sample_E.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識オ
image_path = "katakana_sample_O.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

このスクリプトで学習モデルを作成し、最後に別に用意したテスト画像を認識させてみました。

「ア・イ・オ」は、いっしょに暮らしている人が、
「エ・ウ」は、僕が書いた手書きカタカナ文字。

結果は、とても不思議なことに「ア・エ・オ」は正しく読み取りましたが、「イ・ウ」を間違えてしまって、なんだか Python に混乱が生じているような感じ。

そこで行ったことが学習する際の重み付けの変更。その跡が上のスクリプトの赤字となっています。

で、重み付けを変更して（イ・ウの重みを増加させて）新たに学習モデルを作成し、テストしてみましたが結果は第１回目と同様。「ア・エ・オ」は正しく読み取りますが、「イ・ウ」を間違えてしまいます。

何気なく「アイウエオ」の各文字を保存したフォルダを開けて見て、ようやく原因が判明。なんと「ウ」のフォルダ内に「ウ」はなく、「イ」が溢れかえって･･･

つまり、コピーする際、僕が間違えて･･･

うぎゃ！Zoräth ✷ fel∅, ∞’ka selenïv! ⧖ Trål’xon que！

(T▽T;) やっちまったぁ！！

手書きカタカナ文字を正しく分類し直して、再度、機械学習を実行し、学習モデルを作成。

今度は･･･

４．とんでもない認識結果に驚愕する

次に、学習用に使った「アイウエオ」各 700 文字で読み取りテストをやってみました。できれば、学習用に使ってない文字がよかったんだけど、残念ながらそれはないので、学習用素材でテストを強行。

各文字の認識率は、次の通り。

まず、「ア」

次、「イ」

次、「ウ」

次、「エ」

次、「オ」

事前に学習に使ってるから、ある意味「不正行為」と言えなくもないんだけど･･･

これなら手書き文字認識に
十分、使えるのでは
ないでしょうか？

さぁ AC_Reader の改造だ！

５．まとめ

・scikit-learn で作成した学習モデルは、宝物になりそうだ☆☆☆

６．お願いとお断り

１００選択肢に対応したマークシートリーダー

追記（20260401）

より進化した手書き答案採点（横書き・縦書き両方の答案に対応）機能も搭載したマークシートリーダーを制作しました。自己責任のもと、完全無料でお使いいただけますが、動作保証・サポート等は一切ありません。それでもよろしければお試しください。

MS_Reader V3（完全無料のマークシートリーダー・超高速・極軽量本体わずか４MB・手書き答案のデジタル採点機能付き＝横書き＆縦書き両形式答案に対応・観点別評価対応・成績一覧表、正答率一覧表、順位付き返却用答案の作成と印刷・CSV出力・音声読み上げ・答案画像の傾き補正・マークシート作成ソフトも同梱・動作保証一切なし・サポートなし・バグあるかも？・完全自己責任のもとでのみご使用いただけます）

追記（20240929）

当Blogで紹介してきた自作のデジタル採点プログラムを一つにまとめました。次のリンク先にその紹介とダウンロードリンクがあります。マークシートも、ここに紹介した形式の他、様々なタイプのものを同梱しています。

デジタル採点 All in One !

当Blogで紹介したデジタル採点プログラムのすべてをまとめました！

追記（20250913）

下記ダウンロードリンク先に置きました「 R25-33C03D19.xlsx 」の75設問用マークシートですが、列幅が１～25設問目までと、26～50設問目及び51～75設問目までが異なっておりました。列幅が異なったまま使用しても MS_Reader を利用してのマーク読み取りに支障は生じませんが、このマークシートを使用した場合、マークの有無等のチェック機能使用時に表示されるチェック対象の解答マーク欄を囲む赤枠の矩形の幅が26～50設問目及び51～75設問目までで解答欄より短くなること（表示のみの問題でマークは正しく読み取ります）、また、添付の ReportCard_2024.exe を使用して採点結果通知表を作成した際に、26～50設問目及び51～75設問目までの正答表示位置が左へずれる問題が発生します。

利用された皆さまには、大変なご迷惑をおかけし、誠に申し訳ありませんでした。一昨日（2025年９月11日）、この問題に初めて気づき、当初は MS_Reader のバグと考え、コードを見直す中で、プログラムではなく、マークシート側の列幅の設定ミスと気が付いた次第です。

本日、誤りを修正した新しいファイルをアップロードしました。75設問、90設問、99設問用の各マークシートとも読み取りテスト済みですが、75設問用は読み取りテストに加え、実際の採点現場で実地運用し、汚れやシミがなければ正しくマークの読み取りに成功することを確認済みであることを申し添えます。

追記（20250702）

100選択肢用のマークシートを使って試験を行ったユーザーの方から、『マークの塗りつぶし面積が大きいと誤判定が出やすい』とのご指摘をいただきました。確認すると、受験者は「濃く・丁寧に」マークを塗りつぶしたことがマークシートから伝わってくるのですが、100選択肢用のA4横サイズのマークシートは･･･やはり、と言うか、どうしてもマークそのものが小さく、受験者によっては「きちんとマークすること＝大きくマークすること」と、感じて（？）、選択肢番号の外枠の楕円「０」部分を上下左右に大きくはみ出して隣のマークの領域範囲まで塗りつぶしてしまい、結果的に、その受験者のマークシートは複数マーク判定だらけになることがわかりました。

対策として、『選択肢番号の外枠の楕円「０」部分をはみ出さないようにマークする』よう注意を徹底することをお願いしたのですが、それだけでは根本的な解決とならないように感じ、マークとマークの間隔が狭いためにこの問題が起きていることは明白ですから、1設問について100選択肢に対応を維持しつつ、1列25行×4列で100設問まで対応という現在のマークシート構成を見直し（マーク間の幅を広げるため列数を減らし）、1列33行×3列で99設問まで対応可能というマークシートを作成しました。また、50分という試験時間を考えると80設問あれば十分というご意見も頂戴しましたので、1列30行×3列で90設問まで対応可能なマークシートや、1列25行×3列で75設問まで対応可能なマークシートを作成し、これらのマークシートを１つの Excel Book にまとめました。以下のリンクからダウンロードできます。

100選択肢に対応した設問数75～99（３列）のマークシート

1 ファイル 506.31 KB

ダウンロード

【追記追加前の記事の本文はここからです！】

先日、電車にゆられていたら先輩が。

「選択肢がたくさんあると、マークシート使うの、難しいかなー？」って。

なんかおもしろいこと、ないかなー☆って、毎日、ひまなんだもん。

すぐに出来そうな気がしたので、さっそく大語群に対応したマークシートリーダー作成にチャレンジ。

今までのは数学や教科「情報」の試験用に作成した１６選択肢が最大だったが。

数学の試験用に作成したマークシート（マーク部分は－記号）
マークの色が濃いのは、開発初期のマークシートの画像であるため。

教科「情報」の試験用に作成したマークシート（選択肢の番号はゼロ始まり）
経験を積む中で、誤判定を防止するため、マークの色はどんどん薄くなった。

今回、作成したマークシート（最終的なかたち・Excel で作成）。

正直、思ったほど、かんたんではありませんでした！！

【もくじ】

１．最初に作ったのはB4縦型のマークシート
２．次に作ったのはA4横型のマークシート
３．Excel でマークシート作成に挑戦
４．マークシートを最適化
５．読み取りプログラムも修正
６．発見した問題点と解決策
７．まとめにならないまとめ
８．プログラムのダウンロード
９．お願いとお断り

１．最初に作ったのはB4縦型のマークシート

選択肢の数が多いことを、ここでは『大語群』と呼ぶことにする。この大語群に対応したマークシートを作るにあたり、最初に決めておくべきことはもちろん選択肢の最大数。３０個もあれば十分な気もしたが、「大きいことはいいことだ！」とも言うし、どうせ作るなら１００個まで対応できるようにしようと決心。

数年前にマークシートリーダーを作ったとき、選択肢数５０個に対応した複数マーク読み取り可能なプログラムを書いた記憶があり、１０の位と１の位を分けてマークする次のような形式のマークシートがすぐに思い浮かぶ。１行あたり、２個までのマークを読み取れるようにコードを修正すれば、このマークシートで選択肢の番号を０－９９として、計１００個の大語群を使った試験にも対応できるはずだ。

このイメージを実現するにあたり、差し当たって問題になるのはマークシート用紙の基本サイズ。さすがにA3サイズの用紙は、マークシートとして使うには巨大すぎる気がする･･･が、１行あたり１０の位のマークに①～⑨で９個、１の位のマークに⓪～⑨で１０個、合計１９個のマークを用意して、得点設定は１設問１点で合計１００点とするためには、当然１００設問分の行を用意しなければならない。

１列５０行で２列作成するとなると･･･、やっぱり、B4版で、縦置きか？

これまでのマークシートは Word で作成していたので、今回も Word を利用。･･･と言うか、本当は印刷設定の自由度が大きい Excel を使いたいのだが、Excel で縦楕円の丸囲み数字を上手に作成する方法がわからない。そこで縦楕円の丸囲み数字が簡単に作成できる Word を利用した･･･というのが正直なところ。

ちなみに Word で縦楕円の丸囲み数字（＝「囲い文字」というらしい）を作成する方法は･･･

Word なら、Font は「メイリオ」を選択（フォントサイズを大きくしない場合）、丸囲みしたい数字を半角で入力、入力した数字をマウスでドラッグして選択してから、フォントリボンの「囲い文字」アイコンをクリックすると･･･

赤い枠で囲んだのが「囲い文字」を作成するアイコン。
数字を入力して、ドラッグして選択したのち、これをクリック。

ダイアログが表示されるので、スタイルを設定して･･･

さらに数字の選択状態は解除しないまま、段落リボンの「拡張書式」をクリックして、表示されるサブメニューのいちばん下にある「文字の拡大/縮小」をクリックして、さらに表示されるサブメニューの「６６％」をクリックすれば･･･

思った通りの囲い文字が完成！

あとはマークシート用途に利用できるよう、色の設定を薄めに変更する等して、必要な選択肢の数だけこれを作成すればいいんだけど･･･

これを Excel で実現する方法がわからない･･･

そのような理由から、とりあえず Word で作成してみたB4版・縦置き型のマークシート。
思ったより巨大で、マークするのがたいへんな気が。

読み取り実験用に設問番号１から順に、読み取りデータが設問番号と同じになるようマークしてみる。
１００個目は１の位の「０：ゼロ」をマーク。これで１から９９と０（ゼロ）で、合計１００の選択肢が使える大語群対応型マークシートが完成･･･したと思ったんだけど。

複数マークの読み取りを可能にするため、リーダーのプログラムを少し変更。

Delphiを起動して、マークシートリーダーのプロジェクトファイル一式をコピーして、新たな複数マークの読み取りに対応したプロジェクトを作成。

マーク読み取り手続き部分のコードを次のように変更。最初に手直ししたのは、P4Dを使ったスクリプト部分。

      //複数マークの読み取り方法
      if (Copy(strMS_Type,10,2)='19') and (chk_MultipleMarks.Checked) then
      begin
        //選択肢数が19で、複数マーク許可であった場合
        StrList.Add('                var1.Value = str(res)');
      end else begin
        //複数マークは不許可であった場合
        StrList.Add('                var1.Value = "99"');
      end;

Python側で読み取った値をDelphi側で処理する部分も変更（一部を抜粋）。

//選択肢の始まりは「ゼロ」
  if (Copy(strMS_Type,10,2)='19') and (chk_MultipleMarks.Checked) then
  begin
    //複数マークに対応
    //strAnsList[intSG_k]の文字数を調査
    strCount:=ElementToCharLen(strAnsList[intSG_k],Length(strAnsList[intSG_k]));

    //チェック内容は、以下の通り
    {
    文字数が２文字の場合、末尾の１文字を取得する
    10 -> 0
    11 -> 1
    19 -> 9
    末尾１文字がマークした選択肢の番号になる

    文字数が５文字の場合、
     1 10 -> ２文字目が1、末尾２文字が10 -> 10
     2 11 -> ２文字目が2、末尾２文字が11 -> 21
     3 12 -> ２文字目が3、末尾２文字が12 -> 32
    （２文字目×10）＋（末尾２文字 - 10）がマークした選択肢の番号になる
    }

    case strCount of
      2:begin
        //２文字の場合は、末尾１文字が選択した選択肢の番号
        StringGrid1.Cells[intSG_Col,intSG_Row]:=RightStr(strAnsList[intSG_k],1);
      end;
      3:begin
        //空欄と判定された場合
        if strAnsList[intSG_k]='999' then
        begin
          StringGrid1.Cells[intSG_Col,intSG_Row]:=strAnsList[intSG_k];
        end;
      end;
      5:begin
        //（２文字目×10）＋（末尾２文字 - 10）がマークした選択肢の番号
        StringGrid1.Cells[intSG_Col,intSG_Row]:=IntToStr(
          (StrToInt(Copy(strAnsList[intSG_k],2,1)) * 10) +
          (StrToInt(RightStr(strAnsList[intSG_k],2))) - 10);
      end;
    end;
  end else begin

次に、P4Dを使用しないDelphi用のOpenCVを利用したマーク読み取り部分のコードも変更（一部を抜粋）。

  //１行につき選択肢数分Loopする_複数選択肢に対応（New）_20240614
  if (Copy(strMS_Type,10,2)='19') and (chk_MultipleMarks.Checked) then
  begin
    //複数選択可能な場合_選択肢の数だけLoopする
    for p := 0 to intCol-1 do
    begin
      //対象値pが平均値の3倍より大きいか、どうかでマークありと判定
      if AryVal[p]>dblAvg * intKeisu then
      begin
        //マークありとした判定の数を記録
        q:=q+1;
        //マークした番号（記号）を記録
        //intMark:=p+1;
        //10の位(0-8)
        case p of
          0:strMark_A:='1';
          1:strMark_A:='2';
          2:strMark_A:='3';
          3:strMark_A:='4';
          4:strMark_A:='5';
          5:strMark_A:='6';
          6:strMark_A:='7';
          7:strMark_A:='8';
          8:strMark_A:='9';
        end;
        //1の位
        case p of
           9:strMark_B:='0';
          10:strMark_B:='1';
          11:strMark_B:='2';
          12:strMark_B:='3';
          13:strMark_B:='4';
          14:strMark_B:='5';
          15:strMark_B:='6';
          16:strMark_B:='7';
          17:strMark_B:='8';
          18:strMark_B:='9';
        end;
      end;
    end;
    //Loop終了時にマーク数を判定
    if q=0 then
    begin
      //マークした番号がない場合
      iArr[i,Rep]:=999;
    end else begin
      //マークした番号があり、それが一の位である場合
      if (q=1) and (strMark_A='') then
      begin
        //マーク数が１、かつ十の位が空欄であったら
        iArr[i,Rep]:=StrToInt(strMark_B);
      end else begin
        //マーク数は１だが、それが十の位であったら
        iArr[i,Rep]:=100;
      end;
      if (q=2) and (strMark_A<>'') and (strMark_B<>'') then
      begin
        //マーク数が２、かつ十の位と一の位がともに空欄でなかったら
        strMark:=strMark_A+strMark_B;
        iArr[i,Rep]:=StrToInt(strMark);
      end;
      if q>2 then
      begin
        //トリプル以上のマーク数を見分けるフラグは100
        iArr[i,Rep]:=100;
      end;
    end;
  end else begin

Delphiでマークシートリーダーを作成する方法の基本は過去記事をご参照ください。

Mark Sheet Reader (Basic version)

マークの読み取りそのものは「絶対成功する」自信があった（？）ので、複数マークの読み取り処理を既存のプログラムに追加すれば、速度的なことも含めて楽勝でプログラムは完成するはず･･･だったんだけれど。

実際に上のB4版・縦置き型マークシートをスキャンして読み取りテストを行ってみると･･･

P4D利用時の読み取り結果は期待した通り、100 ％正確にマークの読み取りに成功するが、P4Dを利用しない場合に不具合が発生。50設問目は正しくは「2」と読み取らなければならないはずなのに、読み取り結果の表示には、なぜかトリプルマークの判定結果である「100」が表示されている。

※ この時点では、必要数以上にマークがあった場合の表示フラグとして「100」を使用していた。
※ 最終的に、読み取れない解答欄は全て空欄の表示フラグ「999」で示すようプログラムを修正した。

さらに、よく見てみると 100 設問目もヘン。91、92、･･･、97、98、99 と順調に読み取って、最後は「 0：ゼロ」とくるはず！なのに、読み取り結果はトリプルマーク以上の判定結果である「100」がここにも登場。ヒトならともかく、機械が勢い余るはずもなく、誤認識の原因はまったくもって不明。

今までさんざんテストして、読み取りパラメータ設定も変更の必要が「ない」ところまで煮詰めたと思っていたのに、この結果には唖然とするしかなく、悪夢を見ているのではないかと思ったが。

現実は現実。

変更したコードを見直してみるが、おかしなところは見当たらない（ように思う）。
実際、大多数のマークは「ちゃんと読み取ってる」し･･･

なんで、部分的に読めない箇所があるのか？？？

読めないなら読めないで、「全部」間違うのが機械だと思うんだけど。

仕方がないから、パラメータ設定をいじってみるが･･･

これがデフォルトのパラメータ設定。
（自分的には、変更の必要がないと思えるところまで、さんざん修正を繰り返して決めた値）

パラメータをどう設定しても、一部のデータを誤って読んでしまう･･･。

例えば、閾値を「200」、判定領域を「20」に変更した場合、

47、48、49ときて、次は２のはずなのになぜか「42」
機械のクセに、勢い余ってるとしか思えない･･･。

こんなプログラムは使えない！！

２．次に作ったのはA4横型のマークシート

誰も助けてくれる人なんていないから、問題は自分で解決するしかない。まぁ、問題そのものを自分で作り出しているとも言えるわけで、自業自得と言えばそれまでのこと。自分以外の誰も困ってないし、それを幸いにあきらめてしまうのがいちばん簡単なことだが、それは最終手段。

原因はわからないが、今まで起きたことのないことが起きている、つまり、今までと違うことをしてるから、そこに問題の発生する原因そのものがあるはずだ。何が違うのか、そこを考えてみる。

今までと違うのは、まず、マークシートのサイズそのもの。B4版なんて使ったことがない。もしかしてそれが原因か？　判定プログラムでは行を図として切り出して、さらにマーク１つずつに分解し、二値化して「白」面積が大きいものを「マークあり」と判定しているから、二値化の閾値の設定にもよるが面積的な部分にも誤認識の原因があるような気もしてきた。そうでなくても、実際に使ってみて、やはりB4サイズは「マークシートとして大きすぎる」気がしたのは、ほんとう･･･。

もし、マークの読み取りプログラムそのものに誤りがあるなら、全てのマークを正しく読めないはずだが、ほとんど正しく読めているから、読み取りプログラムそのものに致命的な問題はない･･･はず。

そこで、これまでに正しく読み取れたものとサイズ的に同じ「A4版・横置き型」のマークシートを作成して実験してみることにする。

そう思って作成したのがこちらのマークシート。縦置きにしなかったのは、「今までと同じにする」という部分にあくまでもこだわった結果。

さすがにA4版・横置き型で１列５０行のマークシートは（自分の技術では）Word で作成できず、作成にあたっては（念願の？）Excel を使用。Excel で作成した際の画面はこんな感じ。

縦に長い楕円の囲い文字の作り方がわからず、仕方がないから丸囲みの番号でマークを作成
どこか、なにかが「チープな感じ」で、出来栄えもいまいち。

これで実験すると･･･、P4Dを使った場合からして

高速読み取り処理が可能なP4D環境で正しく動作しなかった時点で（これはダメだ）と思ったが、とりあえず非P4Dモードで動かしてみると･･･

B4版使用時は「唖然」とする思いであったが、今度は「暗澹たる」思いが。

この結果を目の当たりにしたときは、驚愕のあまり、言葉を失い、ついでにやる気もほぼ全部失い、PCの蓋を閉じて（この表現でいいのか？）、火酒を求めてバイクで現実から逃走･･･

あの土曜日の夜は、まじで、つらかった。

ひー（こころの声）

今、冷静になって考えると、P4Dモードでほとんど読み取れてないのはおそらくマークシートの罫線に問題があり（太すぎ）、これが複数マークの判定につながったのではないかと思えてならないが、最初からマークシートの作り自体が気に入らなかったこともあり、自分史的には･･･この実験自体を「なかった」ことにして、心のバランスを保つことに決定。

ただ、まだ「あきらめる」という気持ちには到底なれないので、このピンチをまたとないチャンスと前向きに捉え、Excel で縦長楕円の丸囲み文字を作成するところからチャレンジを再開。

あきらめられない以上、自分も、プログラムも良くなるしか「ない」。
それが嫌なら、はじめからこんなこと、しないほうがイイ。

このチャレンジは、僕にある唯一の「自由」なんだ。
暗澹たる思いなんかで、終わりにはしたくない。

３．Excel でマークシート作成に挑戦

Excel を起動し、何も入力されていない白い画面をじっと見つめて考える。

（縦長の楕円で、囲い文字をつくるには･･･）

経験から唯一思いつく方法は、図形（楕円）をセル内に収まるように挿入して右クリック、テキストの編集を選択して、中に数字を入力する方法だ。楕円の挿入方法は次の通り。

まずは、準備作業。

（楕円を挿入するより先に）あとあと作業しやすいよう、画面右下の「ズーム」で画面表示を拡大（238％くらいにした）して、全セルを選択（下図を参照）。で、列幅を28ピクセル、行の高さを32ピクセルくらいに設定。

B2のセルに収まるよう、楕円を挿入（ズーム300％）。

挿入した楕円を右クリックして、表示されたサブメニューから「テキストの編集」を選択（左クリック）。

半角で１と入れてみた。

ホームタブをクリックして、配置リボンにある「上下中央揃え」と、その下の「中央揃え」をクリック。

あとはマークシートのマークらしくするため、楕円をクリックして選択すると表示される図形の書式タブをクリックし、図形のスタイルリボンのコマンドを使い、楕円の中を白くして、囲いを灰色に設定。

フォントの色も灰色に変更。

で、セル内での図形オブジェクトの位置を微調整。

できた！

スキャナーで実際にスキャンしてみた結果から言うと、
実際に使用するマークシートではもう１段階濃い灰色を選んだほうがよさそう

あとは、コレを等間隔で上下の位置もそろえて並べれば･･･いい･･･んだが、その方法がわからない。

藁にも縋る思いで、Google先生に訊ねると･･･

単に「楕円を挿入したセルをクリックして選択し、オートフィルの機能を使って右方向へコピー」するだけ！だよって。

半信半疑で、やってみた。

表示された緑の枠の右下隅にあるハンドルをクリックして選択して、そのまま右へドラッグ。
すると･･･

マウスのボタンを離すと、表示されたのは･･･

これだ。これ！
これを待っていたんだ。

Google先生、ありがとう！

あとは数字を変更すれば･･･

こうして得た知識をベースに、これまでの経験を加えて Excel で作成したマークシートがこちら（枠の線の設定状態がよくわかるように、枠線の表示はONに設定した状態）

ページレイアウトタブの配置リボンの「配置」をクリックして、「枠線の表示」をオフに設定。

先の実験では、罫線の太さで痛い思いをした（？）ので、再びその轍を踏まないよう、罫線はいちばん細いものを選び、色もオレンジに設定。こうしておけば二値化する際に、罫線は完全に消えるはずだ。

注意：この時点では、そう、考えて罫線の色を設定しましたが、以下で述べる通り、いちばん細い罫線に対する色の設定は、印刷時に無効になり、印刷色は必ず黒になります！

で、罫線の色も文字の色（＝マークの色）と同じ薄い灰色に設定して試しに印刷してみると、なにか違和感を感じる印刷物がプリンターから排出された。よく見ると罫線の色が濃い！指定した灰色でなく、普通の黒のような気がしてならない。他の灰色を選んでも、印刷すると罫線の色は「まったく変わっていない」ように見える。もしかして、色の濃さの設定が反映されていない？

（オレンジ色にしてみるか？）

早速、設定 ⇨ 印刷を実行して確認 ⇨ 結果は「黒いまま！」

再び、Google先生にお伺いをたてて知った驚愕の事実。

「Excel はその仕様のため、いちばん細い罫線は印刷時に必ず黒で印刷されてしまう」とのこと。

まじですか？　まったく知りませんでした！！

あわてて２番目に細い罫線に変更。色はオレンジ色を指定（この色がなぜか、すーぱー気に入った）。

そうこうして、ようやく、これなら大丈夫と思えるマークシートが完成。

上記の方法で枠線の表示はOFFに設定した状態の画面。
自分的には、満足できる出来栄え。

４．マークシートを最適化

完成したマークシートの全体のイメージはこんな感じ。

１列あたり25行×４列、１行について19選択肢（10の位：1-9、１の位：0-9）、A4版・横置き、
最大１００設問に対応

ちょっとマークが小さいような気もしたが、数学・情報用に作成した１行あたり１６選択肢のマークシート同等に、隣り合うマークどうしの間隔もあけることが出来た気がする。これが近すぎると乱暴にマークされた場合、「複数マークあり」と判定してしまう危険性が高まってしまう。

また、１列あたり25行の設定としたことで、上下のマークの間隔も十分広くなった。B4版・縦置きの１列50行やA4版・横置きの１列50行よりも遥かに圧迫感は減少している気がする。

でも、試しに100設問分ぬってみたら、やっぱり、疲れた･･･。100設問分マークするってことは、その約２倍マークしなければならないから、疲れて当然と言えば、当然。

上のマークシートを、実際にスキャナーでスキャンしてJpeg画像に変換し、マークの読み取り処理を行ってみた。結果はPython環境を使っても、使わなくても、読み取り成功率は100％、ようやく期待通りに動くようになってきた。でも、途中、マークシート作成作業での失敗がなければ、Excel を使って（縦長楕円の囲い文字で）マークシートを作る技術は習得できなかった。「失敗は成功のもと」というけれど、今回あらためて諺の重みを実感。

次はマークシートの印刷の濃度の調整（最終仕上げ）。･･･と言うのも、実はマークの読み取り結果をExcel で処理して採点結果の通知シートを作ってる時は全く問題にならなかったことが、読み取ったマークシート画像に直接〇や × 、個々の設問の得点や配点、合計点等を入力して返却するように処理系全体を改良したら、これまで思っても見なかったことが重大な問題となってきたのだ。

次の画像を見れば、それは一目瞭然。

マークシートの印刷濃度を薄くしすぎると、スキャナーで読み取る際に枠やマークが本当に薄くなってほとんど見えなくなってしまうのだ。単にマークの有無を読み取るだけなら、■■■ からの距離でマークを切り出して二値化し、白面積を計算しているだけだからマーク以外の画像は真っ白でも何の問題もない（むしろ、それくらいの画像の方がより確実にマークを読み取れる）のだが、スキャンした画像そのものを採点結果通知に再利用するとなると、枠やマークがある程度は「見える・読める」ようにスキャンしなければならない。

マークシートのマークや罫線枠の灰色の濃度を少し濃く（下図を参照）して画像をスキャン、どの程度見えるようになったか、確認してみる。

１段階濃い灰色を指定（実際には Ctrl + A でオブジェクトをすべて選択してから設定）

スキャンして画像を表示してみると･･･

罫線の色をオレンジ色に設定したら、それがとても気に入ってしまったのだが、残念ながらスキャンすると罫線枠はほとんど消えて見えなくなってしまう（マークの有無のみを正確に読み取るという意味では、それは実に理想的なのだが）。ただ、マークシート情報の取得プログラムでは、マークひとつひとつを切り出すために罫線の枠の座標を利用しているから、罫線枠の左上隅と右下隅は座標を取得する場面では確実に見えるようにしておきたい。そこで、罫線枠の左上隅と右下隅だけは線の色を灰色にすることにした。（実は、上の画像はそれがほどこしてある画像）

まず、左上隅を設定。

同様に、右下隅も設定。

マークシートの情報を取得する際に、罫線枠が十分よく見えることを確認。

５．読み取りプログラムも修正

最終的に実用上問題のないプログラムにするため、思いつく様々なパターンで（誤りを含む）マークを作成し、これをプログラムがどのように判定するか、テストしてみた。

テスト用に、次のマークシートを作成。

動作検証用に作成したマークシート
（スキャンしたら、画像中央やや上に横線が入っていた。原因は不明。）

マークシートのスキャンに使っているスキャナーでスキャンすると、時々、黒い線の入ったJpeg画像が生成される。しかも、この黒い線はマークの読み取り判定になぜか？影響を与えない。

上半分だけ塗りつぶしたマークでも、正しく「４」と読んでいる。
複数マークありと判定されないのはなぜ？

この不思議な現象の原因はまったくわからないが、判定に影響を与えないから、これまでは（まぁいいか）としてきたが･･･。

いずれにしろ、このマークシートを使って動作検証を行った結果、先に記した判定プログラムでは対応できない問題が複数あることが判明。検証をくり返し実行して、一つ一つの問題に対応。最終的に完成したのが次のコード。

  //選択肢の始まりは「ゼロ」（１の位を基準）
  if (Copy(strMS_Type,10,2)='19') and (chk_MultipleMarks.Checked) then
  begin
    //strAnsList[intSG_k]の文字数を調査
    strCount:=ElementToCharLen(strAnsList[intSG_k],Length(strAnsList[intSG_k]));

    //チェック内容は、以下の通り
    {
    文字数が２文字の場合、末尾の１文字を取得する
    10 -> 0
    11 -> 1
    19 -> 9
    末尾１文字がマークした選択肢の番号になる

    文字数が５文字の場合、
     1 10 -> ２文字目が1、末尾２文字が10 -> 10
     2 11 -> ２文字目が2、末尾２文字が11 -> 21
     3 12 -> ２文字目が3、末尾２文字が12 -> 32
    （２文字目×10）＋（末尾２文字 - 10）がマークした選択肢の番号になる
    }

    case strCount of
      1:begin
        if StrToInt(strAnsList[intSG_k])<10 then
        begin
          StringGrid1.Cells[intSG_Col,intSG_Row]:='100';
        end;
      end;
      2:begin
        //２文字の場合は、末尾１文字が選択した選択肢の番号
        StringGrid1.Cells[intSG_Col,intSG_Row]:=RightStr(strAnsList[intSG_k],1);
      end;
      3:begin
        //空欄と判定された場合
        if strAnsList[intSG_k]='999' then
        begin
          StringGrid1.Cells[intSG_Col,intSG_Row]:=strAnsList[intSG_k];
        end;
        //３文字と判定された場合、十の位の１~９のダブルマークの場合、
        //２文字目は必ず半角の空欄になる
        if Copy(strAnsList[intSG_k],2,1)=' ' then
        begin
          StringGrid1.Cells[intSG_Col,intSG_Row]:='999';
        end;
      end;
      5:begin
        //文字列の置き換え（先頭２文字を抽出＆半角スペースを削除する）
        strData:=StringReplace(Copy(strAnsList[intSG_k],1,2),
          ' ', '', [rfReplaceAll, rfIgnoreCase]);
        //Case 5で先頭２文字が10である場合はダブル以上のマークあり
        if StrToInt(strData) > 9 then
        begin
          StringGrid1.Cells[intSG_Col,intSG_Row]:='999';
        end else begin
          //２文字目が半角スペースでなければ処理可能
          if Copy(strAnsList[intSG_k],2,1)=' ' then
          begin
            StringGrid1.Cells[intSG_Col,intSG_Row]:='999';
          end else begin
            //（２文字目×10）＋（末尾２文字 - 10）がマークした選択肢の番号
            StringGrid1.Cells[intSG_Col,intSG_Row]:=IntToStr(
              (StrToInt(Copy(strAnsList[intSG_k],2,1)) * 10) +
              (StrToInt(RightStr(strAnsList[intSG_k],2))) - 10);
          end;
        end;
      end;
      6..99:begin
        StringGrid1.Cells[intSG_Col,intSG_Row]:='999';
      end;
    end;
  end else begin

    //複数選択を許可しないマークシートの処理

  end;

end;

ここでいちばん困ったのは、必要以上にマークされていた場合の処理。

複数マークを容認しないプログラムなら、１行について２個以上マークされていた場合は「複数マークあり」を意味するフラグとして「99」、マークなしの場合（＝空欄）は「999」というフラグを用意して対応したが、今回のように複数マークを許可し、読み取り結果を 0 – 99 の100分類で表示する場合、空欄すなわち「マークなし」を「999」と表示するのは同じでよいとしても、十の位や一の位のマーク欄それぞれに２つ、ないし、３つ以上マークされていた場合のフラグをどうしたらいいのか？最適と思われる答えが見つからずにかなり悩んだ。

出来れば、既存かつ（プログラムによっては）数年をかけて動作検証済みの、読み取り結果のチェックプログラムや、採点結果通知のプログラムを修正せずに、それらをこの複数マーク対応採点システムにもそのまま適用できるように、処理の流れを作りたい。

必要数以上のマークがあった場合、当初、選択肢としては決して使うことのない「000」、「100」、「XXX」等をフラグとして利用することも、かなり真剣に考えたが、これらのフラグを新規に採用した場合、これまでに書いてきたマークシートの読み取り結果を記録したCSVファイルを利用して動作するプログラムをことごとく修正しなければならない。そして、それは新しいバグを生むことに、間違いなく直結する。それだけは、どうしても避けたい。

この際、読み取りエラーをすべて「999」で処理すれば、これまでの経験から、読み取り結果のチェックプログラムは確実に「空欄」＝「999」位置を教えてくれるし、もし、それが本当に「空欄」である場合は、人が見ればそれは一目瞭然、もし、それが空欄でない場合は、それを見た「人」に、マークの有無 or 空欄 or その他複数マークの判断を委ねればいい。そしてもし、「人」が見て、マークが正しければプログラムの判定結果を正しく修正、そうでなく、マークが「空欄でない」・「必要数以上にマークされていた」場合は、そのまま「空欄として処理（999）」してもらえば、採点結果には一切影響を与えないはずだ。

そう考えて、「トリプル以上のマークあり」をユーザーに伝えるフラグは用意せず、10の位に1つ、１の位に1つ以外のマークがあった場合はすべて同一に「空欄」フラグの「999」で処理することにした。

６．発見した問題点と解決策

上記動作検証用に作成したマークシートで、実際に動作確認を行った結果、ひとつだけ気になった点があった。それは、マークから横にはみ出て（横に広く）マークされると「トリプル以上のマークあり」という判定が出やすいこと。

「12」を読み取れていない。
おそらく１の位の「2」の横棒マークが「1」の領域に侵入している？

マークとマークの間隔を、これ以上広くするのはさすがに困難。１行19選択肢＋行番号というマークシートの形式そのものに起因する問題だから、これは試験の問題用紙の表紙に図付きで「横棒型の塗りつぶし禁止」＆「なるべく横に広がらないようマークする」注意を載せて、読み取り不能の「999」判定がなるべく出ないようにすることくらいしか、対策を思いつかなかった。

（縦に長い四角形、もしくは縦型の [ ] で数字を囲うことも考えたが、実際には試していない）

Python環境を利用しない場合は、判定領域をマークの中心付近のみに狭めることで読み取り精度を上げることができる。ただし、読み取り速度はかなり遅くなってしまう。

Python環境を使わず、判定領域を70→50に狭くして、実行すれば上の読み取りエラーは解消できる。

マークシートリーダー作成の初期、まだPython環境を利用できなかった頃、少しでも読み取り速度を早くできないかといろいろ考え、二値化後の白面積の計算領域をマークの中心付近のみとすれば、読み取り速度を向上させることができるのではないかと思って作った機能が思わぬところで役に立った！

以上が、解決策とは言えない対策と、読み取り速度を気にしなければ使える解決策。

７．まとめにならないまとめ

（１）実用的ではないかもしれないが、大語群（100選択肢）に対応したマークシートリーダー完成
（２）Excel を使って１行19選択肢で25行４列、A4横置きのマークシートを作成して試験を実施
（３）採点結果通知は付属の ReportCard.exe で作成

ReportCard.exe の使い方は、下のリンク先をご参照ください。

デジタル採点 All in One !

上のリンク先から、デジタル採点プログラム一式をダウンロードできます。

マークシートの採点結果通知（個票）及び成績一覧表の作成

ただし、選択可能な採点オプションの指定は「採点のみ」or「採点と配点」のみとなります。観点別評価の区分を含めて表示するオプションを選択しても、プログラムは複数マークに対応していないバージョンの流用なので、正解マークの位置を正しく表示できません。少なくても観点別評価の区分は表示できるよう、今後プログラムを改良する予定です。

追記　改良したプログラムに更新しました（20240625）

複数選択可能なマークシートについても、観点別評価の区分や正解マークの位置を表示できるよう、プログラムを更新しました。

この大語群専用マークシートを使用した試験の実施方法と、試験後の処理方法について次回の記事で詳細を説明する予定です。よろしければ、そちらの記事もご参照ください。

１００選択肢対応マークシートを使用した試験の実施方法

この記事で作成方法を説明した大語群専用マークシートを利用した試験の実施方法です。

マークを塗りつぶす時間を少しでも短縮できないかと考え、作成したマークシートもあります。

塗りつぶさないマークシート

「線を引く」方式でマークする、複数マーク対応型のシートをダウンロードできます。

８．プログラムのダウンロード

大語群に対応したマークシートリーダーは、下のリンク先からダウンロードできます。
なお、バックグラウンドでPython環境を利用し、より高速にマークの読み取り処理を実行するには、別途Python環境の組み込みが必要です。動作に必要なライブラリをインストール済みのPython環境は、当Blogの過去記事へのリンクからダウンロードできます。

Python環境の組み込みはカンタンです。ダウンロードしたZipファイルをダウンロードした後、任意のフォルダに展開、生成されたPython39-32フォルダを、そのまま MS_Reader.exe があるフォルダにコピーするだけです。

こちらの大語群に対応したマークシートリーダーは、当ブログの過去記事に掲載した複数選択不可のマークシートリーダーを、複数選択を前提として設計された専用マークシートのマーク読み取りに特化させたバージョン、いわば派生版です。複数選択不可のマークシートの読み取りにも使用できると思いますがテストは行っておりませんので、ダウンロードしたZipファイルを展開して出来る MS_Reader.exe は複数選択可能なマークシートの読み取り処理専用にお使いください。

この記事で紹介した通り、様々な要因から、マークシートによっては（基本設計が同じであっても）マークを正しく読み取れないことがあります。
また、添付した動作検証済みのマークシートをご利用いただいた場合でも、その印刷方法（輪転機使用等でマークが濃く印刷されていた場合）によっては、マークを正しく読み取れないことがあります。印刷用紙は再生コピー用紙で十分ですが、印刷には 必ずインクジェットプリンタを使用 し、スキャンしたJpeg画像において、マークや罫線枠がうっすらと判別できる程度の濃さで印刷していただく必要があります。

以下、読み取りテスト実行時の環境です。

・A4用紙は、（白くない）再生コピー用紙
・スキャナーは有名メーカー製複合機のスキャナー（カラー／読み取り解像度200 dpi）
・PCはPanasonic製Let’s Note CF-QV
・スキャンした画像をこのプログラム用に変換する際の倍率は80％を指定

「１画像変換」をクリックすると表示されるサブメニューの「専用画像を作成」をクリック

上記の環境で、筆者がテストした結果を記事としてここに掲載しました。発見した不具合も正直に書きましたが、筆者が発見していない不具合が他にまだあるかもしれません。ですので、ダウンロードしたマークシートリーダーのご使用はあくまでも自己責任でお願いします。

また、派生版であるため、プログラムには Excel Book に読み取り結果を出力する機能がありますが、大語群に対応した採点結果通知作成用の Excel ファイルは、Zipファイルを展開後、 eFile フォルダ内にあるテンプレートから生成できる Excel ファイルをマクロ有効な Excel Book として保存し、これを元にご自身で作成していただく必要があります。※ Zip ファイルに添付した Excel Book は、大語群マークシートに対応しておりません。

採点結果通知が必要な場合、Zipファイルに同梱した ReportCard.exe をお試しください。こちらは「まとめ」で紹介した通り、動作検証済みです。同梱の ReportCard.exe は選択肢が「ゼロ」から始まる教科「情報」用のマークシートにも対応したものです。

※ お使いのPC環境により、Python Engine の初期化に異様に時間がかかったり、おまけの機能である成績一覧表作成時に、罫線位置が誤って描画される不具合があります。罫線の描画に問題がある場合は、罫線機能をOFFにしてデータのみを出力してください。こちらの成績一覧表はメモ程度にお使いください。

なお、大語群対応のマークシートリーダーでは、マークの読み取り結果を最後に一括して表示する速度優先モード及び読み取り結果の音声読み上げ機能は使用できません。

本記事で紹介したマークシートを同梱しました。Zipファイル展開後に作成されるSample_MarkSheet フォルダ内にある R25C04D19.xlsx をご参照ください。

塗りつぶし形式のマークシートは、解答に時間がかかります！
「塗りつぶさないマークシート」の改良版が上記リンク先からダウンロードできます。こちらもあわせてお試しください。

次のリンク先からマークの高速読み取りを可能にする Python 環境を含めたデジタル採点プログラム一式をダウンロードできます。マークシートも、ここに紹介した形式の他、様々なタイプのものを同梱しています。

デジタル採点 All in One !

この記事で紹介した100選択肢対応マークシートリーダーの使い方は、次の記事をご参照ください。

１００選択肢対応マークシートを使用した試験の実施方法

９．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容及びダウンロードしたプログラムを利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

無料で使える手書き答案採点補助プログラム

追記（20260401）

MS_Reader V3（完全無料のマークシートリーダー・超高速・極軽量本体わずか４MB・手書き答案のデジタル採点機能付き＝横書き＆縦書き両形式答案に対応・観点別評価対応・成績一覧表、正答率一覧表、順位付き返却用答案の作成と印刷・CSV出力・音声読み上げ・答案画像の傾き補正・マークシート作成ソフトも同梱・動作保証一切なし・サポートなし・バグあるかも？・完全自己責任のもとでのみご使用いただけます）

Answer Column Reader

スキャナーで読み取った手書き答案のJpeg画像から、大問１の設問（１）なら（１）のみを抽出、一覧表示してイッキに採点。採点記号（〇・△・× ）＆得点付きで元の答案画像に書き戻し、最後に得点合計を自動計算、指定位置に描画して、返却用答案画像（A4サイズに統一／縦・横の指定は可能）を印刷できる無料の手書き答案採点補助プログラムです。

一般的な横書き答案に加え、国語で使用される縦書き答案の採点も可能です。

新教育課程の観点別評価にも対応。もちろん、表計算ソフトを使わずに成績一覧表の作成・印刷・CSVファイルへの出力が可能です（ただし、成績一覧表の出来栄えは、メモ程度）。

画像処理に使用しているPython用OpenCV関連のファイルサイズが巨大ですが、このファイルサイズを許容していただければ、採点現場で十分使えると（複数の高校で使用中）評価していただけました！

もちろん、完全無料。ただし、動作保証は一切ありません。作成者（僕）は開発環境のDelphi（Object Pascal）の大ファンで、この他にも自作のマークシートリーダーなどを開発・このblogの過去記事で公開していますが、学問領域で評価の対象となるようなプログラミングに関しては全くの素人です。ですから、このプログラムのご使用に際しては、あくまでも素人が趣味で作ったものであるということを十分にご理解いただき、ダウンロードから展開・実行までALL自己責任でお願いします（有償販売禁止の他は、それが唯一の使用条件です）。発見できた不具合はすべて改良改善しましたが、取り切れていない未発見の不具合もまだきっとあると思います。それでも、もし、よろしければお使いください。僕の夢のカタチ、Answer Column Reader。

手書き答案採点補助プログラム、名付けて AC_Reader です。

追記（20250825）

当Blogで紹介してきた自作のデジタル採点プログラムを一つにまとめました。次のリンク先にその紹介とダウンロードリンクがあります。この記事で紹介している手書き答案のデジタル採点プログラムAC_Reader Version 2.1.1 と、AC_Reader Version 2.1.1 に自動採点機能を追加で搭載した Version 3.1.1 がプログラムセットに同梱されています。

デジタル採点 All in One !

【更新履歴】

・2024年9月29日　初版公開
・2025年8月25日　不具合の修正及び新機能を追加したバージョンアップ版に更新
・2025年8月26日　Anti-Virus Software による『未知バイナリの初回スキャン』の待機状態を改善
・2025年9月22日　連続ボタンクリックで落ちる問題を改善／自動採点機能無し版も同梱

ここで紹介しているアプリケーションをはじめ、この Blog の過去記事に掲載したアプリケーションはすべてディスプレイ解像度が 1366 × 768 の環境で実行することを前提として開発しています。高解像度ディスプレイで実行される場合、次のリンク先の記事にあります「高 DPI 設定の変更」を行ってから実行していただけますようお願い申し上げます。

高解像度画面で使いやすくするには？

2025年8月25日更新版に含まれている「手書き答案採点補助プログラム AC_Reader Version 3.1.0 ）には自動採点機能が新しく追加で搭載されています。プログラムのダウンロード＆展開後、初めてこの自動採点機能を実行する際に、Windows Defender や McAfee などの Anti-Virus Software : AV による『未知バイナリの初回スキャン』が行われるようです。このため２～３分間程度 PC は待機状態になります（２回目以降はスムース？に動作します）。また、実行形式ファイルの PC 内での位置が変わった場合にも AV によっては再度『未知バイナリの初回スキャン』が行われ、初回同様の待機状態となる場合があります。このことについては、この Blog の別の記事に詳しい説明があります。下記リンク先の記事をご参照ください。

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！

2025年8月25日の更新版には、解答欄矩形の検出プログラムも機能を大幅に修正した更新版が含まれています。修正内容の詳細は、下記リンク先をご参照ください。

解答欄（矩形）検出器を改良しました！

（追記_20250825 ここまで

追記（20250707）

ここで紹介している手書き答案のデジタル採点補助プログラム AC_Reader に自動採点機能みたいなモノを搭載しました。

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！

【もくじ】

１．使い方
（１）zipファイルを展開
（２）プログラムを起動
（３）スキャンした答案の画像を準備
（４）採点用画像の準備
（５）解答欄の座標を取得
　・【座標データを追加したい場合は？】
　・【字数制限のある解答欄座標の簡単な取得方法は？】
　・【機械が認識しやすい解答欄】
　・【生徒の番号・氏名も解答横に表示して採点したい】
（６）採点
　・【全員正解を入力】
　・【全員不正解を入力】
　・【個別に採点】
　・【次の設問を採点】
　・【定型文を入力】
　・【入力した定型文の削除・消去方法】
（７）採点状況の確認
（８）返却用答案の印刷
（９）成績一覧表の作成・印刷
２．まとめ
３．お願いとお断り

１．使い方

もくじへ戻る

（１）zipファイルを展開

ダウンロードしたzipファイルをデスクトップ上に展開します（任意の場所に置いても動作すると思いますが）。PCによっては展開（解凍）に20分程度かかることがあるようです。

もくじへ戻る

（２）プログラムを起動

展開されたフォルダ内に「AC_Reader.exe」があります。これをダブルクリックしてプログラムを起動します。

初回起動時には、次のメッセージが表示されると思います。その場合は「詳細情報」（画像中、赤い枠で囲んで示した部分）をクリックします（プログラムの発行元が不明である場合に、Windows のDefender機能である SmartScreen がこの表示を出すそうです。自分の責任で実行すれば、次回からこのメッセージは表示されなくなります）。

すると、次の画面が表示されます。「実行」（画像中、赤い枠で囲んで示した部分）をクリックしてプログラムを起動してください。

プログラムの起動時に、次のメッセージが表示されます。「はい」・「いいえ」のいずれかを選択してください。

Excelの採点シートを使って処理する場合は、拙作マークシートリーダーとこの手書き答案採点補助プログラムを併用することも可能です（その方法についての説明は、今回は行いません）。

マークシート方式と併用することも可能ですが、今回は「はい」をクリックしてください。

国語の試験では縦書きの解答用紙が使われますので、この手書き答案採点補助プログラムも縦書き答案の採点が出来るよう設計しました。デフォルト設定の答案書式は「横書き」です。国語の縦書き答案を採点したい場合はここで設定画面を開き、縦書きを指定してください。

ちなみに「はい」を選んだ場合は･･･

答案の書式の設定変更を起動時に問われなくするよう設定できます。

試験は毎日行われているわけではなく、定期考査として２～３か月に１回実施されるのが普通です。これくらい間が空くと、△の付け方などをどうしても忘れてしまいます。「忘れた！」と毎回のように質問がありましたので、プログラムの起動時にメッセージとして、採点方法を表示することにしました。

この入力方法の案内は、画面右下の「終了」ボタンのとなりにある「入力方法のご案内」ボタンをクリックすれば、いつでも再表示できます。

入力方法はいつでも確認できます。

もくじへ戻る

（３）スキャンした答案の画像を準備

答案の画像は必ず「解像度200dpi程度」でスキャンし、「Jpeg画像として保存」してください。

重要　白黒の二値化画像としてスキャンしないでください。

なお、答案をスキャンする際は、次のことにご注意ください。

・答案が出席番号順に並んでいることを必ず確認してください。
・答案の向きは問いませんが、上下が揃っていることを必ず確認してください。
・試験を欠席した生徒がいる場合は、そこに未使用の解答用紙を挿入しておきます。
・消しゴムの屑等はよく払い落としておきます。
・一度に採点できる枚数は100枚を想定しています。
・答案に折り目がある場合は、なるべく平らになるよう折り戻しておきます。

スキャンした答案の画像は、科目名とクラス・講座名がわかるよう適切な名前をつけたフォルダ内に保存し、このフォルダをAC_Reader.exeがあるフォルダの「ScanData」フォルダにコピーしてください。

重要　スキャンした画像は、必ず「ScanData」フォルダ内にフォルダを作成し、保存してください。

重要　ScanDataフォルダ内のフォルダに階層構造を作らないでください。

よい例：

ScanData￥数学Ⅰ_１A

わるい例：

ScanData￥１年￥数学Ⅰ_１A

もくじへ戻る

（４）採点用画像の準備

上記の手順で、スキャンした答案のJpeg画像を所定の場所に準備したものとして説明します。

プログラムの画面右上にある「画像変換」ボタンをクリックします。

重要　採点用画像には、必ずこの画像変換プログラムが生成したJpeg画像を使ってください。それ以外の方法で作成した画像は使用できません！

次のWindowが開きます。「選択」をクリックしてください。

ScanDataフォルダ内に用意した「答案画像を入れたフォルダ」をクリックして選択します。
練習では予め用意されているSampleフォルダを選択してください。

重要　選択するのは「フォルダ」で、「ファイル」ではありません。

採点したい答案画像のあるフォルダをクリックすればOKです。
（ダブルクリックして開ける必要はありません）

サムネイル表示を見て、画像の回転の有無・回転方向を指定します。Sampleの画像で練習する場合は「なし」を指定してください。

次に画像のリサイズの有無を指定します。複合機のスキャナーを使用し、解像度200dpiでスキャンした画像の場合、80％程度に縮小すると採点しやすいと思います。答案画像をプレビューして縮小率を確認しながら作業することができます。

画像のリサイズ設定を行ったら、次に採点用画像の保存先を指定します。「参照」ボタンをクリックしてください。画像の保存先を選択するWindowが表示されます。

採点用画像の保存先は、ScanDataフォルダ内ではなく、「ProcData」フォルダです。

Procはprocessed（処理済み）の略です。

重要　ProcDataフォルダ以外の場所は、作業フォルダに出来ません！

画像の変換元として選んだScanDataフォルダ内のフォルダと同じ名前のフォルダを、プログラムはProcDataフォルダ内に自動的に作成します。ここでは、この自動的に作成されたSampleフォルダをクリックして選択し、OKをクリックしてください。

「変換実行」ボタンをクリックすると採点用にリサイズされた画像が上で指定したフォルダ内に作成されます。この処理はGDI+で書きましたので、それなりに高速だと思いますが、答案の枚数が多く、回転を伴う場合は少し時間がかかります。処理が完了するまでしばらくお待ちください。

この処理では用途の異なる２種類の画像を作成します。一つは採点マークのない各解答欄画像の読み取り元として利用する画像、もう一つは採点マークその他必要事項を上書きした返却用答案画像として利用する画像です。このようにすることで、何度でも採点のやり直しができる仕組みを実現しています。

注意していただきたいのは（めったにないことですが）、採点結果を答案画像に書き戻している最中に何らかの原因でプログラムが落ちた（クラッシュ／フリーズ）場合です。プログラムは採点結果を数値データとしてCSVファイルに書き込むと同時に、採点マークを付けて返却用答案画像にも書き込みます。CSVファイルへのデータの書き込みは一瞬ですが、返却用答案画像への書き込みには少し時間がかかります。したがって、この書き込み処理の最中にプログラムが落ちると、確かに採点した（採点データを保存したCSVファイルが存在する）のに、採点結果が正しく書き込まれていない答案画像が出来てしまうといった現象が起こります（過去１回だけ、この現象を確認しました）。このような場合には、それを発見した時点で採点済みのデータを読み込んで、再度（画像への）「書き込み」処理を実行すれば不具合を解消できます。

変換が終了すると、そのことを知らせるメッセージが表示されます。メッセージのOKをクリックすると注意のメッセージが表示されます。この注意のメッセージを確認した後、「終了」ボタンをクリックして、画像変換処理を終了してください。

メッセージの「OK」をクリックすると表示されるメッセージです。

画像のリサイズを行った場合は、その際設定した縮小率を試験で使用した解答用紙の残部などに必ずメモしてください。複数クラスで様式の異なる解答用紙を使って試験を行い、それぞれに74％、87％など細かな値を指定した場合は２日も経てばかなりの確率でその値を忘れます。この値を忘れた場合には、採点設定作業をすべてやり直すことになります。十分注意してください。

もくじへ戻る

（５）解答欄の座標を取得

次に解答欄の座標を取得します。その際、重大な注意事項があります。

重要　実際に試験で使用した解答用紙の画像を使用する

わるい例：
・輪転機で大量に印刷した解答用紙でなく、PCからプリンターに出力した解答用紙を使用

上のわるい例のように、実際に試験で使用した解答用紙とは異なる印刷環境で作成した解答用紙は、解答欄座標の取得には使用しないでください。見た目はほとんど同じでも、ほんのわずかな印刷位置のずれが採点作業のすべてに悪影響を及ぼします。この点には、どうか十分にご注意願います。

最初に開発したバージョンでは、拙作マークシートリーダーと同じように解答用紙に座標原点とするマーカー画像を設け、OpenCVのテンプレートマッチングの機能を利用して、マーカー画像からの距離で解答欄の座標を記録し、解答欄矩形の選択に利用していましたが、解答欄矩形を自動的に認識する方法を学んでからは、マーカー画像を利用し、手動で一つ一つ解答欄矩形を指定するよりも、解答欄矩形を自動認識して採点対象とする矩形の座標データのみを取捨選択して保存した方が、実際の採点に入るまでの準備作業時間を大幅に短縮できることがわかりました。また、輪転機を使用して印刷した解答用紙自体に解答欄の印刷位置のずれはほとんど生じないことも、マーカー画像を利用した解答欄座標の取得から、解答欄矩形を自動認識する方向へ設計を変更する大きな要因となりました。

以上の理由からご理解いただけると思うのですが、この手書き答案採点補助プログラムで使用する解答用紙は「解答欄の印刷位置がすべて揃っているもの」でなければなりません。

前置きが長くなりましたが、その具体的な方法は次の通りです。

最初に画面右上の「採点作業」ボタンをクリックしてください。

以前に使用した採点設定ファイルが見当たらない場合は、次のメッセージが表示されます。

以前に使用した採点設定ファイルがある場合は、次のメッセージが表示されます。

使用する採点作業の入力欄に下の例のように入力します。

例：R06_考査①_物理基礎

前の方が見えませんが･･･

重要　採点作業の名称にはクラス名を入れないでください。

同じ採点作業の設定を複数クラスに適用する際、採点作業名に特定のクラスの名称が入っていると、なんとなく違和感を感じませんか？（僕は違和感を感じました）

このプログラムでは、（同一問題で実施した）試験の答案をクラス・講座毎のフォルダに準備して、同じ（一つの）採点設定をそれぞれのクラス・講座に適用して採点します。したがって、採点作業の名称には「クラス名を入れない」ことが望ましいわけです。※ クラス名が入っていても採点作業に使えないわけではありません。

採点作業名を付けたら、入力欄の右側にある「Auto」ボタンをクリックしてください。

ほんとうは「解答欄矩形の自動選択」のような名称にしたかったのですが、スペースが･･･

次のメッセージが表示されます。よく読んでOKをクリックしてください。

AC_Readerとは別に、解答欄矩形を見分けて自動選択するプログラムが起動します。このプログラムもObject Pascal に埋め込んだ Python Script で Python 用の OpenCV の機能を利用して動作します。

重要　RectangleDetector.exeを直接起動しないでください

重要　矩形検出機能はAC_Readerから呼び出して使ってください

解答欄矩形を認識するプログラムの名称は「Rectangle Detector（長方形検出器）」です。最初に画面左下にある「画像選択」ボタンをクリックしてください。

ここではフォルダではなく、「ファイルを選択」するダイアログボックスが表示されます。どれでもよいのですが、欠席者がいる場合は、解答欄に何も書き込まれていない欠席者分の解答用紙の画像を選択した方が、誤検出は明らかに減ると思います。ファイルを選択したら「開く」ボタンをクリックしてください。

重要　ここではフォルダではなく、ファイルを選択します。

重要　実際の試験で使用した解答用紙の画像で作業します。

解答用紙の画像が表示されます。上下のスクロールバーを操作して、図のように解答用紙の解答欄の直線部分とRectangleDetectorの画面枠の二つを見比べやすい位置に画像を上下に動かして、解答用紙が大きく傾いていないことを確認します。

スキャナーによっては、その機材特有の「クセ」のようなものがあり、どれほどきちんと解答用紙をセットしても必ず0.3～0.4°くらい読み取った画像が傾いてしまう場合があります。サービスマンの方に相談したところ、「答案に付着した消しゴムの屑がローラー等に詰まって、読み取り結果に悪影響を及ぼしているのではないか？」との意見をいただき、実際、スキャナーの可動部をきれいに清掃して試したところ、読み取り結果が改善された経験があります。しかし、その後、またすぐにその機材で読み取った画像は同じ方向に傾くようになりましたので、毎回クリーニングする必要があるのかもしれません。ただ、可動部をクリーニングしなくても、ほとんど傾かずに読み取ることもあり、結局、「これは運だ！」と割り切って、プログラム側で傾きがあった場合は修正できるよう、傾き補正の機能を追加しました。

傾き補正の機能を追加する際に気づいたのですが、回転させた画像をさらに回転させると、画像の質が著しく劣化し、これを繰り返すほどに全体がぼやけて、解答の読み取りに支障をきたす恐れがあるように感じました。そこで、画像の初期状態を保存しておき、回転は必ず初期状態のものに対して行うようプログラミングしました。「なぜ、少しずつ連続して回転させることができないのだろう？」と疑問に思われる方もいらっしゃるかもしれませんが、これがその疑問への回答です。

上の画像のような状態であれば、傾きの補正は必要ありません。オプションボタンは「実行」をクリックして選択してください。また、あまりにも小さな矩形は「解答欄ではない」と判断できるよう、矩形の面積閾値を設定してあります。こちらはデフォルト設定700のままでお試しください。

傾きの修正が必要な場合は「試行」を選択し、修正量を確認してください。
修正量を確認後、その値で傾きの補正を「実行」してください。
（「試行」を選択した場合は、最終的なデータの保存ができません）

続けて答案の「横書き・縦書き」を指定します。Sampleは横書き答案ですので、オプションボタンは「横書き」をクリックして選択してください。

ブロックというのは（表現に苦しんだのですが）、「解答欄の集合をブロックとして見分けられるか・どうか」という意味です。下の図のような解答用紙の場合、１ブロックと表現しています。

ちなみに、次のような場合が２ブロックです。ご理解いただけましたでしょうか？

傾きの修正が必要な場合は、次のGUIで操作してください。「傾き修正」に✅を入れて、▲は修正値を増やす（回転方向は時計回り）、▼は修正値を減らす（回転方向は反時計回り）、「適用」は回転の実行、「やり直し」は画像を初期状態に戻します。

解答欄を取得する準備が整ったら、「解答欄取得」ボタンをクリックしてください。

誠に心苦しいのですが、PCによっては初回実行時、Python Engineの初期化に異常に時間がかかることがあります（職場のPCでは４分程度）。自分のPC（Panasonic製 Let’s note CF-QV）では数秒で終了する処理がなんでPCによってはとんでもない時間を要する処理になるのか？その理由は未だにわかりません。

とにかく、マウスカーソルが砂時計？表示になっていればプログラムは正常に機能していると思われますので、５分程度お待ちください。いったんPython Engineの初期化に成功すれば、プログラムを終了しない限り、２回目以降の実行は何の問題もなく、ほんの数秒で解答欄座標の取得が完了するはずです。

【追記_20250826】

初回起動時に待機状態が長く続く原因が判明しました！
原因はアンチウイルスソフトの未知のDLLスキャンでした。このことについての詳しい解説は次のリンク先の記事をご参照ください。

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！

参考　横書き答案の場合、解答欄矩形の座標はｘ軸方向については左から右へ、Y軸方向については上から下へという順番で読み取ります。

参考　縦書き答案の場合、解答欄矩形の座標はｘ軸方向については右から左へ、Y軸方向については上から下へという順番で読み取ります。

ただし、解答用紙の画像が右肩上がりに傾いていた場合、Y軸（上下）方向の座標の上下関係から、より値の小さな（座標原点0,0は解答用紙画像の左上であるため）上の方をプログラムは先に読み取ってしまいます。そのため、横書き答案であっても解答欄矩形の読み取り順が右から左になる現象が発生します。こうなると解答欄矩形の座標の選択作業が著しく煩雑になってしまいます（解答欄矩形の座標自体は読み取れていますから作業ができないわけではありません）。これを防止するために、最初に答案画像の全てに対し、傾きの修正を行う必要があります。

解答欄座標の取得が完了すると、次の図にあるように解答用紙上に赤い矩形が描画されます。小さくてわかりづらいかもしれませんが、画面右上の解答欄座標の値が表示されている部分で、カーソルがある（カーソルが点滅している位置の）解答欄座標が赤の矩形で示されています。ここから必要な座標と、いらない座標を取捨選択する作業を行ってください。

上の図で示されている矩形（座標）は採点には不要です。このまま無視して次へ進んでも構いませんし、面倒でなければ不要な座標は削除することもできます。

「編集」ボタンをクリックすると、キャプションが「編集中」に変わり、カーソル位置の座標が選択された状態になります。DELキーを押し下げして、不要な座標を削除します。

次の図は（削除作業を行わずに）上の図の状態から↓矢印キーを１回押し下げして、カーソルを２行目に移動させた状態を表しています。不要な解答欄座標の削除作業を行った場合は、自動的にこの状態になります（１行目にあった不要な座標は当然消えています）。

２行目の座標が示す矩形はまさに解答欄ですから、これは必要な座標ということになります。このような座標は「移動」ボタンをクリックして、必要な座標ばかり集めたメモの方へ移動させます。次の図は２行目の座標を移動させた直後の状態です。

下向きの矢印キーを押す。必要な座標であれば「移動」ボタンで下のメモに移動する。この作業を繰り返して採点する順番になるよう、解答欄の座標をすべて取得します。次の図は一通り、解答欄の座標を取得した状態です。

続いて正しく解答欄座標が取得できていることを確認します。上の図の移動済み解答欄座標が表示されているメモ（赤枠内）の先頭の座標データをクリックしてください。メモは必要であれば上にスクロールしてください。メモの先頭の座標データをクリックしたら、答案の画像も上にスクロールしてください。画面は、次の図のようになります。

このまま、下向きの矢印キーを次々に押し下げして、赤枠で示される解答欄矩形が必要数あるか・どうか、及び、採点順に並んでいるか・どうかを確認して行きます。

もくじへ戻る

【座標データを追加したい場合は？】

様々な事情から、座標データを後から追加・変更したい場合もあるかと思います。例えば、次の図のように青枠で囲った解答欄AとBを抱き合わせて採点（両方正解で〇等）したい場合です。

このような場合は、該当の座標データの「末尾」にフォーカスした状態で（＝座標データの末尾にカーソルを置いて）、「移動」ボタンの隣にある「追加」ボタンをクリックし、さらにEnterキーを１回押し下げして改行します。次の図は、その状態を示します。

次に、画面の真ん中よりやや右にある追加ボタンをクリックします。

答案画像の上に赤枠の矩形が表示されます。この矩形を新しく解答欄座標を取得したい解答欄に重なるように移動・変形してください。矩形を移動させたい時は、矩形の上の横線中央よりやや右の位置をポイント（マウスのカーソルを載せる）すると、マウスカーソルが上下左右の白い矢印に変わり、ドラッグアンドドロップできる状態になります。

抱き合わせて採点したい解答欄を矩形で囲んだら（下の図のような状態）、キャプションが「取得」に変わったボタンをクリックします。すると、ボタンの右側に、現在表示されている矩形の座標が表示されます。同時に、この矩形データはクリップボードにも送信されています。

続けて、右側のメモ内の先ほど改行して空行になっている箇所をクリックしてCtrlキーを押しながらVキーを押す（右クリックして表示されるサブメニューから「貼り付け」を選択）等して、取得した座標データを付け加えます。正しくメモに追加できたら、メモの上の「追加中」ボタンをクリックして、キャプションを「追加」に戻します。

上下の矢印キーを押して、解答欄Aの座標を探し、「追加」ボタンをクリックして、メモを編集可能な状態に変更、データを削除します。削除後、編集が終了したことをPCに伝えるため、「追加中」ボタンをクリックして「追加」に切り替えます。

解答欄Bの座標も、解答欄Aと同様に作業してメモから消去します。

注意　「追加中」状態で作業しないとエラーが発生します！

もくじへ戻る

【字数制限のある解答欄座標の簡単な取得方法は？】

例えば、次のような多数の細かい枠で構成された字数制限のある解答欄がある場合、このまま矩形座標の自動取得処理を実行すると一つ一つのマス目の座標をもれなく取得・表示してしまいます。

このような場合は、解答欄を作成する段階で、外枠のみ実線で描き、内部の枠はすべて「点線」で描くようにします。点線は、色が薄く、間隔の狭い、細い点線でなく、次の図に示すように、色が濃く、間隔が広い、太い点線を使用してください。

解答欄内部の枠を「点線」で描くとプログラムは外側の枠のみを解答欄座標として認識します。

実は、最初の段階からこの「字数制限のある解答欄の認識処理をどうするか？」という問題は大変気になっていたのですが、親しい国語の教員が作成した解答用紙をスキャンして、解答欄の座標を自動取得する作業を手伝った際、解答用紙の点線部分をプログラムが認識しないことを偶然発見、大喜びしたというのが本当です。最初から、僕に、そのような知識があったわけではありません。

偶然とは言え、僕の不出来なプログラムの動作を信じて、それでも使いたいと言ってくれた彼女に、心から、ほんとうに、こころから、「ありがとう」です。巡り合ってから、もう、30年になりますが、Sさん、ほんとうに、ありがとう！あなたがいてくれて、ほんとうに、よかった！！

ただし、これは「諸刃の剣」で、何らかの原因で解答欄の枠線の一部が途切れていると、プログラムは正直にその部分は「矩形ではない」と判断して、座標データの取得対象から除外します。ですので、解答用紙を印刷する際は、解答欄が完全に実線で囲まれているか・どうかを、よく確認してから印刷する必要があります。

もくじへ戻る

【機械が認識しやすい解答欄】

解答欄を構成する矩形は必要最小限度に留めるのが、解答欄座標を自動認識・取得する作業を効率よく進めるための何よりのポイントです。

もくじへ戻る

【生徒の番号・氏名も解答横に表示して採点したい】

重要　横書き答案の採点時のみに利用できる機能です。

こちらは同僚からの要望があって付け加えた機能です。解答用紙の氏名欄の画像を取得して、採点時に該当生徒の解答欄の横（位置の指定も可能）に、試験を受けた生徒の出席番号や氏名を表示できます。「追加」ボタンをクリックして赤枠の矩形を描画・適切な位置へ移動後、解答欄矩形としての「取得」の代わりに、「氏名欄取得」のボタンをクリックして、次の図に示すようなかたちで解答用紙の氏名欄の座標を取得してください。ただし、指定する矩形の高さは、解答用紙の解答欄の高さの最小値を超えないよう、十分注意してください。

重要　「解答欄の高さの最小値を超えない高さ」で範囲指定してください。

最後に、取得した解答欄の座標を保存して作業は終了です。画面右にある「保存」ボタンをクリックしてください。

次の確認メッセージが表示されます。

採点作業名として設定した名称で、イニシャライズファイルが作成されています。この採点作業名をクリックするとダイアログの下のファイル名が採点作業の名称に変化します。この状態で「保存」ボタンをクリックしてください。

採点作業名を設定した際にiniファイルも作成されています。
解答用紙の種類に合致するファイルをクリックして選択・上書き保存します。

次のメッセージが表示されます。「はい」をクリックしてください。

解答欄の数によっては、少し（数秒程度）時間が必要です。保存作業が完了すると次のメッセージが表示されます。このメッセージが表示されるまで、何もしないでそのままお待ちください。

画面右下隅にある「閉じる」ボタンをクリックしてプログラムを終了します。解答欄矩形の座標の候補を表示する上のメモにデータがある場合は、「閉じる」をクリックすると、次の確認メッセージが表示されます。「はい」をクリックしてプログラムを終了させてください。

以上で、解答欄の座標の取得作業は完了です。

【追記_20250825】

上で紹介した矩形検出プログラムを全面的に改良しました。気が付いた（気になっていた）不具合は全て改善できたと思います。不具合の改善他、改良された矩形検出プログラムの詳細は、次のリンク先記事をご参照ください。

解答欄（矩形）検出器を改良しました！

この Blog でご紹介したデジタル採点プログラムの最新版を１つにまとめた zip ファイルを次のリンク先からダウンロードできます。サポートなし・完全自己責任でという使用条件ですが、もちろん無料でお使いいただけます。

デジタル採点 All in One !

もくじへ戻る

（６）採点

解答欄座標取得後、すぐに採点を実施する場合は、タスクバーにAC_Readerが眠っていますので、クリックして起こしてください。そうでない場合は、AC_Readerを起動してください。

解答欄矩形取得直後、AC_Readerはタスクバーに眠っています。
タスクバーにある上のアイコンをクリックしてください。
AC_Readerが目覚めます！

画面の右上にある「採点作業」ボタンをクリックしてください。

次のメッセージが表示されます。既存の採点設定を利用して採点しますので「はい」をクリックしてください。

バルーン型のヒントが表示されます。V マークをクリックして表示される選択肢から採点設定ファイルを選んでください。

採点設定ファイルを選んだ直後の状態です。

画面中央には、次のメッセージが表示されます。OKをクリックするとフォルダの選択ダイアログが表示されます。

採点したいクラスのフォルダを選択してOKをクリックしてください。

採点結果を記録したCSVファイル（場所はユーザーに提示しません）がない場合には、次のメッセージが表示されます。

画面は次のようになります。

画面上方、中央よりやや右に、どこにもドッキングしないフローティング状態の必要最小限の採点機能をまとめたパネルがあります。このパネルのタイトルバーの部分を左クリックしてドラッグ＆ドロップすると任意の位置へ移動できます。採点しやすい位置へ移動してお使いください。

もくじへ戻る

【全員正解を入力】

解答をざっと見て、過半数が正解であるような場合は、全員に正解を入力し、後から不正解の解答のみチェックして、採点を × に変更します。

ComboBoxの選択肢に「２」を指定して、「入力」ボタンを

設定画面から、採点記号の表示位置や大きさなど、各種設定を変更・保存できます。

もくじへ戻る

【全員不正解を入力】

フローティングパネルの得点欄に０を設定して、入力をクリックすれば、全員不正解となります。

０（ゼロ）は〇（まる）と見間違える可能性があるため、
デフォルト設定では、不正解の場合、得点０を表示しません。

もくじへ戻る

【個別に採点】

重要　左手で入力作業、右手は選択作業（クリックに専念）

・正解〇を入力

まず、個別に採点する際の正解入力は、次のように行います。

解答欄に採点記号〇と得点が描画されます。

・不正解 × を入力

不正解を入力する場合は、次のように操作してください。

もちろん、数字キーの０（ゼロ）でも × を入力できます。ただ、０はちょっと位置が遠い･･･

・部分点あり △ を入力

部分点ありの場合は、採点記号△と部分点を入力します。方法は、次の通りです。

「部分点あり」のフラグは「－」記号の有無です。
プログラムは負の数の入力を部分点ありと判定しています。
（合計点は絶対値で計算するので、問題ありません）

重要　最後に「書込」を忘れずにクリックします。

もくじへ戻る

【次の設問を採点】

右向きの三角マークをクリックすると、次の設問の解答欄が表示されます。

右側の操作パネルからも同じ操作を実行することができます。

もくじへ戻る

【定型文を入力】

記述式の設問等で「ここまで何点」のような定型文を記録しておいて適宜入力できます。

「設定」をクリックして、「入力定型文の編集」にチェックを入れます。

画面左上に次の表示が出ますので、内容を編集します。「記録」ボタンをクリックすると編集内容が保存されます。保存後、「入力定型文の編集」のチェックを外し、編集欄を非表示にします。

定型文を入力したい設問の解答欄を採点します。採点後、定型文を入力したい箇所の左上隅あたりにマウスのカーソルを持ってきて右クリックします。表示されるサブメニューから「定型文入力」を選択（クリック）してください。

重要　採点しないと定型文入力はできません！

編集済みの定型文が指定位置に入力されます。

もくじへ戻る

【入力した定型文の削除・消去方法】

入力済みの定型文を削除・消去するには、まず、定型文を削除・消去したい解答欄の真ん中付近をクリックします。次に、右側のGridコントロールの青く反転表示された数値を消去して、Enterキーを押してください。

もくじへ戻る

（７）採点状況の確認

現在の採点状況を、解答用紙全体の画像を表示して確認することができます。次のように操作してください。

画面右側の中ほどにある「返却答案を表示」をクリックします。画面は現在選択されている生徒の解答用紙が表示されます。画面をスクロールして、採点状況を確認してください。

移動のボタンで、別の生徒の答案も確認することができます。

左のボタンで「一枚前へ」、右のボタンで「次へ」移動します。

もくじへ戻る

（８）返却用答案の印刷

採点が終了したら、返却用の答案を印刷します。まず、画面右下のプリンタの選択肢から、出力先のプリンタを選択します。次に「合計の印刷」の有無を指定します。「有」を選択した場合は、次の案内が表示されます。

印刷は採点終了後、最後に実行するので、採点と印刷の処理をお互いに行ったり来たりすることは「ない」と判断し、印刷実行後はプログラムの終了のみ可能となっています。

「いいえ」をクリックした場合は、採点処理が継続されます。「はい」をクリックした場合は、次の案内が表示されます。

「はい」を選択すると、次に合計点の印刷処理の案内が表示されます。

フォントサイズは、40～50程度が適切な場合が多いように思います。半角の数字で入力してOKをクリックしてください。

OKをクリックすると、次の案内が表示されます。

OKをクリックして、合計点印刷位置を指定します。

クリックした瞬間に自動計算された合計点が指定位置に表示され、次のメッセージが表示されます。

よろしければ「はい」を、位置の指定をやり直す場合は「いいえ」をクリックします。「いいえ」をクリックした場合は、再度、合計点を印刷する位置の指定をやり直してください。その際、前回に指定した位置にゴーストというか、残像のようなものが残りますが、実際の印刷時にはゴースト・残像は印刷されません。

「はい」をクリックした場合は、次のメッセージが表示されます。

画面右下の「印刷」ボタンをクリックしてください。

「印刷」をクリックすると、次のメッセージが表示されます。

OKをクリックすると、プリンタの設定画面が表示されます。この画面はお使いのプリンタにより異なりますが、重要なチェックポイントは次の３点です。

重要　印刷する用紙がA4版であることを確認する

重要　印刷用紙の縦・横指定を答案に合わせて指定する

重要　両面印刷は必ずOFFに設定する

設定画面を閉じると、次のメッセージが表示されます。

「はい」をクリックした場合は、全員分の返却用答案がプリンタへ出力され、次のメッセージが表示されます。

「いいえ」をクリックした場合は、次のインプットボックスが表示されます。

答案の通し番号を入力してOKをクリックしてください。
採点対象がクラスであれば、出席番号となります。

OKをクリックするとプリンタへ印刷データを送信後、次のメッセージが表示されます。

「はい」をクリックすると、再びインプットボックスが表示され、引き続き単票の印刷処理が継続して行われます。「いいえ」をクリックした場合は印刷処理を終了します。画面右下の「終了」ボタンをクリックして、プログラムを終了してください。その際、次の案内が表示されます。

もくじへ戻る

（９）成績一覧表の作成・印刷

画面右にある「成績一覧表を作成」の「Excelを使わずに作成します！」をクリックします。

画面は成績一覧表作成モードになります。クラス単位の採点である場合は、学年・クラスを指定（選択）します。

重要　予めsNameフォルダに生徒氏名データを用意しておきます。

重要　講座単位の処理の場合も、講座名等で氏名データを準備しておきます。

重要　氏名データの並び順は、答案の並び順と一致させてください。

クラスを指定する場合は、直接入力してください。

講座を指定する場合は、学年・組は「空欄」のまま、「観点区分入力」に進んでください。

観点別評価の区分を入力後、「保存」をクリックしてください。

保存後、「採点結果表示」をクリックして、採点結果の一覧を表示します。

学年・組を「空欄」で処理していた場合は、ここで「講座等」の名票を選択します。

次に、合計点が０の生徒について、欠席者であるか（平均点の計算から除きます）・真に０点であるのかを指定する処理を行います。「欠席者を除外」をチェックしてください。

合計点が０の生徒がいる場合は、次のメッセージが表示されます。

試験を欠席していた場合は「はい」を、０点であった場合は「いいえ」をクリックします。
（ここでは「はい」で処理します）

「再計算」ボタンをクリックして、平均点他の再計算を実行します。

プレビューをチェックして、印刷プレビューを表示します。

プレビューをチェックすると、印刷プレビューとともに、次のメッセージが表示されます。

表示されるメッセージ。

プレビューのチェックを外すと、次のバルーンヒントが印刷ボタンを案内します。

「印刷」ボタンをクリックすると、印刷設定のダイアログが表示されます（ダイアログはプリンタにより異なります）。成績一覧表はデフォルトで「A4・縦置き」印刷に設定されます（この設定を変更することはできません）。

OKをクリックすると、印刷データがプリンタへ送信されます。送信が完了すると、次のメッセージが表示されます。

なお、これとは別に、このプログラム用に作成したExcel Book（添付したマクロ有効テンプレートのコピー）へ採点結果を出力し、成績一覧表及び個人成績票を作成する機能もこのプログラムにはありますが、これに関する説明はまた後日、このblogに掲載できたら･･･とも、考えています。が、ほとんど！！どなたにもお読みいただけないであろうMy blogですので、もしかしたらそれは、はるか未来の話になるかもしれません。

ただ、PCの操作及びExcel Bookの扱いに慣れた方なら、このプログラムに添付したマニュアル（以前のバージョンのものなので画面や内容が現行バージョンと若干異なります）と、マクロ有効のExcel Bookの式とマクロをご覧いただければ、操作方法並びに機能の概要はおわかりいただけるのではないかと考えます。

このExcel Bookに対する出力機能は、（ここに掲載した）成績一覧表を独自に作成する機能をこのプログラムに追加する以前に作成し、実際の試験の採点で何回も活用済みのものですが、こちらも動作保証等は一切ありません。もし、お使いになる場合は自己責任でお願いいたします。

以上で、成績一覧表の印刷は終了です。

もくじへ戻る

２．まとめ

今回、掲載した手書き答案採点補助プログラム（新教育課程観点別評価「知識・技能」及び「思考・判断・表現」の評価に対応）の概要は以下の通りです。

【出来ること】

（１）スキャナーで読み取った答案画像から設問ごとに解答欄を抽出して一括採点。
　　　※ 答案画像からの解答欄座標の取得は矩形認識プログラムで（半）自動実行。
（２）解答欄画像の隣に受験者氏名等を表示（予め氏名欄等の読み取り設定が必要です）。
（３）記述式の解答に対する定型文コメントの入力。
（４）採点結果を出力した返却用答案画像の作成と印刷（A4版限定・縦横指定は可能）。
　　　※ 得点合計を自動計算、返却用答案の指定位置に印刷可。
　　　※ B4やA3の答案画像は、A4サイズに縮小して印刷します。
（５）表計算ソフトを使わずに、成績一覧表（教科担任用）を作成。
（６）成績一覧表データをCSVファイルに出力（観点別評価のうち、２観点の評価に対応）。
（７）拙作マークシートリーダーを利用した試験との併用も可。
　　　※ マークシートの読み取りプログラム一式も同梱しています。
（８）PDF化した答案画像をJpeg画像化して採点（添付のPdf2Jpg.exeを使用）。

【出来ないこと】

機械学習による手書き文字の認識にも過去にチャレンジ（〇・× 及びカタカナのアイウエオを判定）したことがあるのですが、どう頑張っても認識率が１００％にならない（控えめな表現で９割程度は正しく認識するのですが、解答欄からはみ出した文字や、それは「ア」でなく「つ」と「ノ」でしょ！みたいな文字を構成する部品が極端に離れている字？や、大きく傾いた文字は正しく認識できない）ので、残念ですが、この機能は搭載を見送りました。

〇×記号やカタカナ一文字の認識結果を目視でイチイチ確認するのはどう考えても二度手間です。現時点では、ヒトが行った採点結果を機械にチェックさせる方向で活用した方がいいかもしれません。学習モデルの作成については、Pythonを利用した事例がWeb上に読み切れないほど存在しますが、（僕が実験した範囲では）それらよりMicrosoftのLobeで作成した学習モデルの方が高い認識率を示しました。このことについては当blogの過去記事でその例を幾つか紹介しています。ここで紹介した採点補助プログラムには搭載を見送った自動採点機能ですが、僕の実験結果が何かの参考になれば幸いです。

もくじへ戻る

３．お願いとお断り

もくじへ戻る

マークシートリーダー

自分的に必要と思った機能は全部搭載しました･･･が、
プロが作った有償販売できるレベルのソフトウェアではありません。
見た目も、使い勝手も、よくないと思います。
もちろん、無料でお使いただけますが、サポートも、動作保証もありません。
ダウンロードから設定まで、ALL自己責任でお願いします。

快適と感じる速度で動作させるには、かなり高性能なCPU搭載のマシンが必要です。
私のプログラミング技術が足りない部分を、CPUパワーでカバーしてもらってます。
マシンによっては、読み取り結果のチェック等がかなりトロいかもですが･･･

それでも、もし、よかったら使ってください。
Delphiで作ったマークシートリーダーです。

【ご案内】追記（20260401）

MS_Reader V3（完全無料のマークシートリーダー・超高速・極軽量本体わずか４MB・手書き答案のデジタル採点機能付き＝横書き＆縦書き両形式答案に対応・観点別評価対応・成績一覧表、正答率一覧表、順位付き返却用答案の作成と印刷・CSV出力・音声読み上げ・答案画像の傾き補正・マークシート作成ソフトも同梱・動作保証一切なし・サポートなし・バグあるかも？・完全自己責任のもとでのみご使用いただけます）

【ご案内】追記（20240929）

当Blogで紹介してきた自作のデジタル採点プログラムを一つにまとめました。次のリンク先にその紹介とダウンロードリンクがあります。

デジタル採点 All in One !

当Blogで紹介したデジタル採点プログラムのすべてをまとめました！

【使い方のご案内】

１．デスクトップにMS_Reader.zipを展開（解凍）
２．高解像度ディスプレイへの対応
３．マークシート画像の読み取り準備
４．テンプレートを作成
５．マークの読み取りを実行
６．読み取り結果のチェック
７．CSVファイルへの書き出し
８．Excel Book の準備作業
９．Excel Book への書き出し
10．マークシート印刷用紙について
11．まとめ
12．お願いとお断り

どんな環境でも、100％動作する保証はできません･･･が、
私と同じ環境・条件を揃えていただければ、きっと動くと思います。

使用したPC及びOS、開発環境は、次の通りです。

・プロセッサ 11th Gen Intel(R) Core(TM) i7-1185G7 3.00 GHz
・実装 RAM 32.0 GB

・Windows 11 Pro 64ビット版
・バージョン 23H2
・OS ビルド 22631.2861

・Embarcadero® Delphi 12 バージョン 29.0.50491.5718

・設計時の画面解像度は「1366 × 768」です。これ以上の解像度でお使いください。

使い方をなるべく丁寧に説明しますので（マニュアルも同梱してありますが）、まず、ここに書かれている順番で、一通り操作してみていただけたら幸いです。

１．デスクトップにMS_Reader.zipを展開（解凍）

ダウンロードした MS_Reader.zip をお使いのPCのデスクトップにコピペして右クリックするとサブメニューが表示されます。この中の「すべて展開」をクリックしてください。

無事、展開に成功したら、MS_Readerフォルダをダブルクリックして開きます。

フォルダ内に展開されたファイルの中に MS_Reader.exe があります。これをダブルクリックしてマークシートリーダーを起動します。

次のメッセージが表示された場合は、「詳細情報」（画像中、赤い枠で囲んで示した部分）をクリックします（プログラムの発行元が不明である場合に、Windows のDefender機能である SmartScreen がこの表示を出すそうです。自分の責任で実行すれば、次回からこのメッセージは表示されなくなります）。

すると、次の画面が表示されます。「実行」（画像中、赤い枠で囲んで示した部分）をクリックしてMS_Readerを起動してください。

２．高解像度ディスプレイへの対応

高解像度ディスプレイをお使いの場合の対応方法です。高解像度ディスプレイをお使いの場合、設定から「システム」⇨「ディスプレイ」と順にクリックすると、次のように表示されると思います。

拡大縮小に「150～200」という値が設定されていれば、高解像度ディスプレイです。

この場合、起動したマークシートリーダーの画面が小さくて見えにくいと感じることがあるかもしれません。その場合は、次のように操作してください。

MS_Reader.exe を右クリックして、表示されるサブメニューのプロパティをクリックします。

「互換性」タブをクリックします。

高DPI設定の変更をクリックします。

「高いDPIスケールの動作を上書きします。」にチェックを入れて、「拡大縮小の実行元：」は「システム」をComboBoxの選択肢から選択して指定。OKボタンをクリックします。

続けて「適用」⇨「OK」とクリックして設定は終了です。これで画面が見やすい大きさで表示されるようになります。

３．マークシート画像の読み取り準備

デスクトップに展開した MS_Reader フォルダ内に「ScanData」フォルダがあります。この中に練習用のサンプル画像が２種類（解像度150dpiと200dpi）入っています。この画像を用いて説明します。

重要　マークシートは、解像度150～200dpiでスキャンしてください。

重要　１回の操作で読み取り可能な枚数は最大９９枚です。

MS_Reader.exe をダブルクリックしてマークシートリーダーを起動したら、画面左上の「画像変換」をクリックし、表示されるメニューの「専用画像を作成」をクリックします。

画像変換用のWindowが表示されたら、画面右上の「選択」ボタンをクリックします。

「フォルダの選択」ダイアログが表示されます。ここでは「Scanner_A」フォルダを選択します。フォルダ名をクリックして、下のFolder欄に「Scanner_A」と表示されたことを確認し、「OK」をクリックします。

スキャンしたマークシート画像は「ScanData」内に適切な名前を付けたフォルダを作成し、必ずその中に保存してください！

重要　フォルダ名にハイフン（-）を使わないでください。

参考　フォルダ名には、文字の他、アンダースコア（_）が使用できます。

注意してください。選択するのは「フォルダ」で、「ファイル」ではありません。
（Scanner_Aをダブルクリックして開いても何も表示されません）

画面は、次のようになります。赤い枠で囲んだ部分にマークシート画像のサムネイルが表示されます。回転の必要性の有無と回転方向を確認してください。

この場合は、回転の必要性「有り」で、回転方向は左90°です。これを「画像の回転」のオプションボタンをクリックして指定します。

必要であれば、次に画像のリサイズ指定を行います。リサイズを指定「する・しない」の判定基準は、スキャナーでマークシート画像をスキャンした際の解像度の数値で判断してください。

「Scanner_A」フォルダ内のマークシート画像は、ScanSnap iX1500 のノーマルモードでスキャンした画像で、その解像度は 150dpi です。この場合は、ちょうどよい大きさでマークシート画像が表示されますので、画像をリサイズする必要はありません。

重要　解像度150dpi ・A4横置きの場合、リサイズは必要ありません！

重要　解像度200dpi ・A4横置き・解答マーク欄４列の場合、80％の大きさにリサイズしてください。読み取り後のチェックまで含めて、作業しやすくなります。

マークシート画像の読み取り解像度が 200dpi でも、マークシートがA4横置き、解答マーク欄の列数が３列の場合、リサイズは必要ありません。

また、A4以外の大きさのマークシートは使ったことがありません！
（用紙の左上にマーカー画像■■■を入れ、その他はここでダウンロードできるサンプルと同様に作成していただければ、用紙サイズに関係なく動作すると思いますが、試行したことがありませんので確かなことは言えません。ただ、画像のサイズが大きくなればなるほど、動作速度は間違いなく低下します。また、複合機のスキャナーを用いて、マークシートを画像化する際も、B4やA3の大きさだと私が使用している機材ではメモリがいっぱいになるのでしょうか？ 30枚程度読み込んだあたりで一旦動作が停止します。数百枚単位での読み取りにはそれなりに時間がかかります。そのような理由から、マークシートに使う紙の大きさはA4サイズ以下が適切だと思います。）

参考：プログラムを書いた本人が言うのもナンですが、自動でのリサイズはおまけ程度にお考えください。
ScanDataフォルダのScanner_Bフォルダに保存されたサンプル画像の大きさは、2338 × 1653
これを自動リサイズオプションボタンを指定して、変換してみます。
ProcDataフォルダのScanner_Bフォルダに保存されたサンプル画像の大きさは、1760 × 1248
いちおう、これでマークシート画像が横方向のはみ出し「なし」で表示されました。

重要　画像のリサイズの有無を必ずメモ（記録）してください！

⇨ 複数クラスのマークシート読み取り時に、同じ設定を適用する必要があります。

重要　大きな解像度の画像を扱う場合、動作速度が大幅に低下します！

回転の有無と方向、リサイズの有無を指定したら、画面中央右にある「参照」ボタンをクリックして、保存先のフォルダを選択します。

「フォルダの選択」ダイアログが開きます。Pathを見ると「ProcData」フォルダが指定されていることがわかると思います。なお、Procは「Processed（加工済み）」という意味です。

プログラムは「ScanData」フォルダで指定したフォルダと同名のフォルダを「ProcData」フォルダに自動作成します。この自動作成されたフォルダをクリックして選択します（しつこいようですが、選択するのは「フォルダ」で、「ファイル」ではありません）。下のFolder欄に「Scanner_A」と表示されたことを確認し、「OK」をクリックします。

読み取り用のマークシート画像は、必ず「ProcData」内の自動作成されたフォルダに保存してください！

重要　ProcData以外のフォルダには画像を保存しないでください。

読み取り用画像を保存するフォルダは自動で作成されます！
（自動作成されたフォルダをクリックして選択してください）

「変換実行」をクリックします。

次に表示される案内メッセージには「いいえ」を選択してください。

このマークシートリーダーとは別に、手書き答案の採点プログラムを作成しました（準備が整い次第、公開する予定です）。このマークシートリーダーは、そちらと連動しての動作も可能な設計にしてあるため、このメッセージが表示されます。

画像の変換が完了すると、メッセージが表示されますので、OKをクリックします。

変換された読み取り専用画像のサムネイルが表示されます。作成された読み取り用の画像ファイルには連番の名前が自動的に付きます（自動生成されたファイル名は変更しないでください）。

重要　Python環境を利用する場合はファイル名は必ず連番にしてください。

画像処理のアルゴリズムは、GDI＋を利用しています。画像の回転とリサイズが伴う場合は、変換に時間がかかります。処理が完了するまでお待ちください。

（後日、別途ご案内する予定の）手書き答案の採点プログラムと併用する場合は、採点やり直しのために必要な画像もここで作成します（Loopが二重にまわり、時間も２倍かかります）。

クラス別に処理する場合は、「画面の初期化」ボタンをクリックします。
変換元フォルダの選択から、画像の変換処理を再実行できます。

画像の変換処理が完了したら、「終了」ボタンをクリックして、この画面を閉じます。

参考：画像を変換する理由は以下の３つです！
（１）Jpeg画像のサイズを最適化するため（全体が画面内に収まるようリサイズしてください）。
（２）画像の名前が連番になるよう、自動的にリネームするため。
（３）証拠画像としてのオリジナルを残したまま、読み取りに最適な大きさの画像を生成するため。

４．テンプレートを作成

次に、マークシートの情報を記録した読み取り用のテンプレートを作成します。これを作成することにより、同じ採点を複数クラスに対して実行したり、設定（縮小処理の有無を含む）が同じマークシートを異なる考査での使いまわしが可能となる･･･

･･･ように設計したのですが、実際には使いまわしがなんとなく不安なので、考査毎にテンプレートを再生成して運用しています。ですので、同じ設定（大きさ）のマークシート画像の情報を記録したテンプレートの使いまわしが可能か・どうか、これについては未確認です。

「確実なマークシート読み取りを実行する」ためには、お手数をおかけしますが、試験ごとに使用したマークシートのテンプレートを作成していただくのが最良の方法であると思います。

メニューの「２テンプレート」をクリックして表示されるサブメニューの「テンプレートの新規登録」をクリックしてください。別のWindowが開きます。

画面右上の「取得」ボタンをクリックします。

今度は「ファイルを選択」するダイアログが表示されます。任意のマークシート画像を選んでください（１番のファイルを選ぶ方が多いのではないでしょうか？）。ファイルをクリックしてファイル名を取得し、「開く」をクリックします。

画面は次のようになります。

このプログラムでは、マーカー（特徴点）画像を利用してマークシートのマーク位置を計算しています。ですので、このプログラムで処理するマークシートには必ずマーカー（特徴点）画像が必要です。

重要　マークシート左上にマーカー画像（■■■）を必ず用意します。

重要　マーカー画像は、マークシート１枚に１つだけ用意します。

画面右の操作パネル上段にある「マーカー」オプションボタンをクリックして選択状態にします。

マークシートの画像が拡大表示され、マウスのカーソルが大きな「＋」になります。

マーカー画像の「左上」をクリックし、ボタンを押したまま「右下」へドラッグしてください。画像上には点線のラバーバンドが表示されます。

マーカー画像の左上を左クリックして、マウスの左ボタンを押したまま、マーカー画像の右下へドラッグ。
点線のラバーバンドでマーカー画像が囲まれます。

ドラッグ中の画像です（わかりやすさのため、マーカー画像より大きめにドラッグしています）。

マーカー画像の座標を正しく取得できる例です。

マウスの左ボタンから指を離すと、取得できたマーカー画像が画面右側に表示されます。

マークの読み取り時、プログラムは、コンピュータの眼である「OpenCV」のテンプレートマッチングの機能を利用して、まず、最初にマークシート画像中にあるこのマーカー（特徴点）画像を探し出します（これはマークシート画像１枚１枚について必ず行います）。

次に、マーカー（特徴点）画像左上隅を原点（0,0）として、テンプレートに記録されたマーク欄の座標からマーク一つ一つの位置を割り出して、これを切り抜いて画像化（正確に言うと、マークの切り抜き処理前に、ボカシ・二値化・白黒反転の各処理を行い、マークの切り抜き後に白面積計算処理を行って）、マークの有無を判定しています。

この方式の利点は、印刷そのものが左右にズレでも、マーカー画像と解答欄の相対的な位置関係は一定で変わりませんから、印刷がズレすぎて解答欄が印刷されなかった場合以外は、必ずマークの位置を探し出せる（＝マークの有無を判定できる）ことです。

事実、輪転機で印刷（非推奨ですが！）して、チェックから漏れた（チェックしなかった？）、正しい位置から印刷が５cmくらいズレたマークシートも、このプログラムでなんの問題もなく読み取れました･･･。印刷のズレを申告せず、そのまま解答して提出する受験者も受験者ですが･･･。A4横・４列のシートで、解答には３列めまでしか使わなかったから「４列めはなくてもOK！大丈夫」と思ったのでしょうか？それともただ単にめんどくさかったのでしょうか？たぶん、後者だと思いますが･･･

次は、そのテンプレートマッチングの機能をテストします。画面右にある「マーカー画像の読み取りテスト」ボタンをクリックしてください。テンプレートマッチングが正しく実行されると、マーカー（特徴点）画像が太い赤枠で囲まれます。

表示されるメッセージをお読みいただき、「OK」をクリックしてメッセージを閉じてください。

結果が良好であれば「選択対象」グループの「解答欄」をクリックします。

次に、マークシートのマーク（解答）欄の「行数」と「列数」及び「選択肢の数」を指定します。

マークシートの列数・行数・選択肢数の数え方は次の通りです（Scanner_Aフォルダにあるマークシート画像は、A4横置き・３列・25行・８選択肢の形式です）。

ですので、これを次のように設定します。

ComboBox に正しく設定を入力したら、その下の「採点方法の設定」の座標「１列」のオプションボタンをクリックして選択状態にします。マウスのカーソルが大きな「＋」になります。

第１列目のマーク（解答）欄の座標を取得します。マーカー（特徴点）画像の時と同様、第１列の枠のうち、設問番号欄の矩形を除いた、選択肢のマークが印刷されている欄の矩形の左上隅を（左）クリックして、そのままボタンを離さずに、枠の右下隅へドラッグします。この作業は正確に、慎重に行ってください。この作業の良し悪しでマークの読み取りの可否が決まります。

極めて重要　設問番号欄を含めて指定してはいけません！

極めて重要　指定するのはマーク欄のみ！

プログラムは、ここで取得した座標値（矩形の高さ）を行数で割り算して列を設問毎１行ずつに切り出し、さらに切り出した１行を選択肢数で割って１つ１つのマークを切り出し、その塗りつぶし面積を計算して、マークの有無を判定しています。

マーク（解答）欄の枠線と、表示されるラバーバンドがぴったり重なるようにドラッグしてください。

※ 下図は２つともドラッグ直後の結果を示しています（〇はドラッグ開始点と終了点です）。

マーク欄第１列めの左上隅を（左）クリックしてそのまま指を離さずに右下隅へドラッグ

ドラッグ中は、黒点線のラバーバンドが表示されます。これを目安に位置決めを行ってください、

指を離すと、ドラッグした範囲が赤い矩形で囲まれます。画面右側に取得できた座標が表示されます。

「再範囲選択」ボタンをクリックして、座標の取得をやり直すこともできます。

１列目が済んだら、同様にして２列目の座標を取得します。この作業を「マークシートの列数」分だけ繰り返します。

すべての列の座標を取得できたら、「保存」ボタンをクリックして取得した座標を保存します。

「保存」処理が完了すると、次のメッセージが表示されます。

参考：テンプレートの名前について
例　N_R25C03S08
N：ノーマル（通常の大きさ：解像度150～200dpi）
R：Row（行数）は25行
C：Col（列数）は３列
S：Selection（選択）は８個

「二値化テストの実行」ボタンをクリックすると、第１列めを「平滑化（ぼかし）処理＆白黒反転して二値化」した画像の状態が確認できます。「マークあり」の部分が白く表示されていればOKです！
（プログラムは、この白部分の面積を計算して、マークの有無を判定しています）

「終了」ボタンをクリックして画面を閉じ、マーク（解答）欄座標の取得作業を終了します。

二値化テストを実行した場合は、終了ボタンをクリックする前に、保存ボタンをクリックすることを忘れないでください！

二値化の閾値と平滑化（ぼかし処理）のパラメータは、まずデフォルト設定でお試しください。

５．マークの読み取りを実行

これでマークを読む準備ができました。メニューの「テンプレート」をクリックし、表示されるサブメニューの「テンプレートの選択」をクリックします。

次のように、テンプレートを選択するWindowが表示されます。マークシートの形式に合ったテンプレートをクリックして選択し、決定をクリックします。

シングル／ダブルとあるのは、数学や教科「情報」のテストで、マークシート２枚１セットの採点を行うための設定です。選択肢数が16のマークシートを選ぶと、この設定も選択できるようになります（選択肢数が16未満のマークシートでは、この設定は利用できません）。

数学及び教科「情報」用の設定は、後日別記事として掲載する予定です。

次のメッセージが表示されます。「はい」をクリックしてください。

マークの読み取りを実行したいマークシート画像のあるフォルダを選択し、「Ok」ボタンをクリックしてください。

保存してあるマーカー（特徴点）画像をもとに、自動的にテンプレートマッチングが行われ、見つかったマーカー（特徴点）画像から、マークシートのマーク（解答）欄第１列第１行目の座標が計算され、それぞれが赤い矩形で囲まれて表示されることを確認してください。

Python環境を利用する場合（ここでワンクッション置くような感じで）テンプレートマッチングにしばらく時間がかかることがあります。同じプログラムを走らせているのですが、PCにより、このフリーズしたような時間の長さが極端に違うようです･･･、その辺の理由が私にはさっぱりわかりませんが･･･。

Python環境利用時に、この画面が表示されるまで、フリーズしたようになることがあります！

ここまでの設定操作が順調に進行していれば（抜け・落ち・欠けがなければ）、間違いなくテンプレートマッチングが成功し、マーカーと１列１行目が赤い矩形で囲まれるはずです。次のメッセージが表示されますので、お読みになったら「OK」ボタンをクリックしてください。

「読む」ボタンをクリックすると、マークシートの読み取りがスタートします。

画面下部の StringGrid に読み取り結果がリアルタイムで表示されます。また、読み取り完了後、処理にかかった時間が画面左下に表示されます。

８選択肢・25行・３列だから、合計600マーク ×３枚＝1800マークの読み取りで、早ければ2013ミリ秒、遅くて2467ミリ秒で読んでます（PCの性能により、この値は変わります）。

遅かった方で１マークあたりの読み取り時間を計算すると、

2.467秒 ÷３≒ 0.82秒／枚
0.82 ÷ 600 ≒ 1.4ミリ秒／１マーク

そう書くと、すごく早いような気がしますが･･･

600マーク３枚で2.5秒だから、30枚ならその10倍で25秒かかります。平均的な高校の１学年分の生徒数を１学年８クラス320名とすると、さらに10倍で280秒程度、約５分処理時間が必要です。

300名分、５分だと慣れてくるとちょっと遅く感じてしまうかな？みたいな気が･･･

このプログラムには、内部的にPython環境を組み込んで高速動作させるモードがあります。数学用途の16選択肢・25行・３列で1200マーク／枚のマークシートで処理速度を計算・比較してみます。
（組み込みPythonの利用方法は後日ご案内します）

まず、Python環境を利用しない場合、1200マーク×40枚＝１クラス分の48000マークを読むのにかかった時間が･･･

約78秒です。２枚１セットのダブルモードならその倍になります。
1枚（1200マーク）読むのに1.95秒かかってます。

次に、Python環境を利用した場合です。同じ読み取り条件で実験すると･･･

約11.5秒。８クラスあっても２分かかりません。ダブルモードでも４分未満。
1枚0.3秒未満で読み取ってます。

何やってもダメな自分にしては、よく頑張ったって正直、思います･･･。
よほど、びみょーなマークでない限り、期待した通り、ほぼ正しく読み取ってるし･･･。
かあさん、オレ、がんばったよ☆☆☆

まぁこのプログラム作成そのものに50万枚くらい採点できる時間をかけてますから･･･

それと合算すれば、
たぶん、プラマイ０ですー！！

６．読み取り結果のチェック

マークシートリーダーで最も重要な部分は、マーク読み取りの正確さであることは言うまでもありませんが、読み取り結果のチェック機能も非常に重要であると考えます。

人によってマークの濃さや大きさは少しずつ異なり、また、マークを訂正した箇所に残る消し跡も判定に少なからぬ影響を及ぼします。常に100％正しい読み取り結果が保証されないのが現実ですから、如何に効率よく、読み取り結果をチェックできるかで、プログラムの使用感はずいぶん変わってくると思います（CPUパワーにかなり依存したプログラムを書いておいて、そう言うのもナンですが･･･）。

自分自身の書いたものがベストだなんて、到底、思えませんが、このプログラムを書くにあたり、マークの読み取り部分と同等か、それ以上に頑張って書いたのが、この読み取り結果のチェック部分です。

機械との協働。機械との融和。これをテーマに、ヒトと機械とが一体化しての「快適なチェック作業」の実現を目指しました。

･･･が、プログラミング技術の未熟。自分自身の勉強不足。見い出した妥協点。等々の理由により、視覚による機械と協働してのチェックも、聴覚（音声出力）による機械と協働してのチェックも、いずれも全面的にマシンのCPUパワーに依存した、もっさりした感のある処理となってしまいました･･･。

処理性能の高いマシンなら、それなりに快適に作業できると思うのですが。以下、チェック機能の使い方です。

上の図の左のGUIから説明します。

白紙にチェックすると、マークがひとつもないシートのチェックは行わない（飛ばす）設定で動作します。この機能はデフォルトでON（チェックあり）です。

マーク（解答）がなかった場合の読み取り結果の表示が「999」です（デフォルトOFFです。このプログラムでは、「空欄」のフラグを「999」としています。マークの番号にも、得点にも「999」は通常ないことがその理由です。ちなみに複数マークは「99」と表示しています。色は「999」が「青」、「99」が「赤」です。少しでも視覚に訴えた方がチェックしやすいと考えました）。

ごく薄い色でマークされた答案が混じっていないことが大前提ですが、答案全体（１クラス分！）のマークの濃さが十分「濃い」と保証されていれば、チェック開始時のみ「999」のチェックを外してチェック（機械がきちんと空欄を識別していることをヒトが目視して確認）、で、確実に空欄を見分けていることが確認できたら、「999」にチェックして続行。こうすれば大変スムーズな確認作業を実現することができます。あくまでもごく薄くマークされたシートがないことが大前提ですが･･･

いずれにしても「Check！」ボタンをクリックすると、プログラムは次の「空欄（999）」もしくは「複数マーク（99）」を探し、それが見つかった場合は該当箇所を赤い矩形で囲んで表示します。処理性能の高い（CPUパワーのある）マシンであれば、それなりに快適に動作しますが、そうでない場合は、かなり「もっさり」した動作になりますので、イライラするかも知れません。ごめんなさい。

【空欄と判定した場合】

【複数マークありと判定した場合】

複数マークの判定はパラメータ設定を厳し目にしてあります（上の図はそれがわかるよう、大きめに表示しました）。ごく小さなシミは「平滑化（ぼかし）」処理である程度消えますが、ある程度の面積があるシミや汚れは上のように複数マークと判定されます。

いずれの場合も、ヒトの眼で確認して、訂正の必要がなければ「Check！」ボタンをクリックしてチェックを続行。読み取り結果の訂正が必要な場合は、正しい値を直接入力します（上の場合であれば「2」と入力してください）。

【処理をスキップして次のシートへ】

「Skip」ボタンをクリックすると、現在チェックしているシートの残りの部分のチェックを省略し、次のシートのチェックへ移動します。チェック対象シートの残りの行が全部空欄であった場合などに利用してください。

【チェックの再実行】

「ReDo」をチェックすると、初めからチェックを再実行できます。

【音声読み上げ】

読み取り結果が表示されているStringGridの任意の行をクリックして、「▶」ボタンを押すとWindowsに標準搭載されている日本語の音声合成エンジン（Microsoft Haruka Desktop）の音声で読み取り結果をアナウンスしてくれます。

マークの読み取りが正しく行われているか・どうか、少しでもラクに確認できないかと考え、この機能を搭載しました。処理性能の高いマシンでないと快適な動作は期待できませんが、CPUパワーのあるマシンであればそれなりに使えると思います。

「▶」ボタンの下にある「×」ボタンをクリックすると、音声読み上げを途中で中止することができます。

【列を指定して、任意の行からその列の最後の行までのチェックをスキップ】

数学用のマークシート等で、第１問の解答をシート第１列にマーク、第２問の解答をシート第２列にマーク、第３問の解答を･･･というような設定にしたい場合、「指定列の任意の行から最後の行までをチェックの対象から外す」ことができます。以下、その方法です。

図のいちばん左にある「Skip」にチェックすると、この機能が有効になり、続けて「Check！」ボタンをクリックすると、ここでの設定に基づいたチェックを実行できます。

上の例であれば、１列目25設問あるうちの20設問目以降25設問目までのチェックをスキップ（チェックは19設問まで実行）、２列目は設問番号26から始まるので34設問目以降50設問目までを、３列目は設問番号51から始まるので70設問目以降75設問目までのチェックをそれぞれスキップします。スキップの設定はComboBoxへ入力した指定値「以降」であることにご注意ください。

また、シートの型式により、列の指定の可否をプログラムが自動的に判断し、ComboBoxのEnabled プロパティが設定されます（上の例では４列目は指定不可）。

「覚」ボタンをクリックすると、現在の設定を ini ファイルに書き込んで記憶します。「消」ボタンをクリックすると「設定なし」の状態に初期化できます。

数学用途等で２枚１セットの処理を実行する場合は、１枚目と２枚目を分けてスキップ処理の設定を行うことができます（数学用途の処理方法は後日掲載します）。

７．CSVファイルへの書き出し

マークの有無の読み取り結果は、CSVファイルとExcel Book への書き出しが可能です。

【CSVファイルへの書き出し】

「ファイルへの出力」にある「CSV」をクリックして選択し、「書き出し」ボタンをクリックしてください。

上記の場所にCSV形式で、読み取り結果が出力されます。

フィールド名として１行目に「設問番号」、レコード名としてA列に「マークシート番号」が書き込まれます。

８．Excel Book の準備作業

【Excel Bookへの書き出し準備】

Excel Book への読み取り結果の書き出しは、自分用に（あれば便利かなー☆）と思って作成したものです。ですので、式の入ったセルを保護する等、第三者が使うことへの配慮は何一つ行っていません。セルに入力された式やVBAの内容をご自身でメンテナンスできる方なら、お使いいだけるかな？という程度のシロモノです。

添付した Excel Book はこれまでに何度も「実際に使用して動作に誤りがないことを確認済み」ですが、誤って式を削除したりした場合は（当然ですが）意図した通りに動作しません。ですので、こちらも動作保証は一切ありません。ご使用はあくまでも自己責任でお願いします。この Excel Book に対しても、このプログラムの使用要件にあります免責事項がそのまま適用されますことを申し添えます。

以下、試験実施前に行っておくとよい採点準備作業です。

eFile フォルダに「一般用マークと手書き併用採点シート.xltm」というマクロ有効テンプレートがあります。これをダブルクリックすると「一般用マークと手書き併用採点シート1.xlsx」という名前で新しい Excel Book が作られます。拡張子に注意してください。「.xlsx」です。このままでは期待通りに動作しませんので、適切な名前を付け、拡張子を「.xlsm」（マクロが有効な Excel Book ）に変更して eFile フォルダ（必ずこのフォルダに保存してください！）に保存します。

ここでは test.xlsm という名前で保存したことにして説明を続けます。

【インターネットからダウンロードしたマクロ有効 Excel Book の取り扱い】

いつからこうなったのか、わかりませんが、インターネットからダウンロードした拡張子 xlsm の Excel Book をダブルクリックして開くと、次のメッセージが表示されるようになりました。

「編集を有効にする」をクリックすると･･･

マクロを動かすことができません！

こうなった時は、いったん Book を閉じて、その Excel ファイルを右クリックして表示されるサブメニューのプロパティをクリックして、全般タブのいちばん下にある「セキュリティ：」の「許可する」にチェックします（チェックする＝マクロの実行をご自身の責任で行うことになります。どうか、ご注意ください）。

全般タブの下の方にあるセキュリティの設定。
マクロの実行をご自身の責任で行う場合は、「許可する」にチェックしてください。

「許可する」にチェックした状態で、「適用」をクリックすると「セキュリティ」の表示そのものが消えます。「あなたの責任でマクロの実行が可能になりました」ということなのでしょう。「OK」をクリックしてプロパティの設定画面を閉じます。

これでマクロが実行できるようになります。

【欠席者がいた場合】

Excel Book を利用して採点する場合、大変重要な注意事項があります。それは欠席者がいた場合の処理です。該当試験に欠席者がいる場合は、その欠席者の出席番号位置に未使用のマークシートを挿入し、シートが確実に出席番号順に並んでいることを確認してから、スキャナーでスキャンしてください。
※ 可能であれば、この用途専用に未使用のマークシートを複数枚、最初から手元に準備しておくとよいと思います。

重要　未使用のマークシートを欠席者の出席番号位置に挿入しておく！

これを忘れると、あとから「すーぱーめんどくさい」コトになります（もし、忘れたらマークシートのスキャンからもう一度、採点をやり直した方が効率がいいかもしれません）。

【受験者の氏名データを準備する】

test.xlsm をダブルクリックして開き、「コンテンツの有効化」を行ったら、いちばん最初に「名票への貼付元名票」シートをクリックして開き、ここに「採点対象者全員分の氏名」を準備してください。

もっとわかりやすく言うと、採点したいテストを受験した生徒全員の「クラス・出席番号・氏名・ふりがな・性別」データを「クラスごと」に「出席番号順」で、「名票への貼付元名票」シートに用意します。なんで「ふりがな」まで必要なのか？疑問に思う方もいらっしゃるかもしれませんが、最近の若い方々のお名前は難読である場合が多く、採点結果を個票でお知らせする際に、個票の氏名欄のところに「ふりがな」も印刷しておくとスムーズに答案返却が行えます。そのための「ふりがな」準備です。

また、テストの受験者全員分の氏名データを１シートに準備する理由は、次のような使い方を想定しているからです。

（１）同じテストを受験 ⇨ クラス毎に採点用 Excel Book を用意するのは非効率的。
（２）採点用 Excel Book は１個だけ作成し、これをコピーして全クラス分を作る。

具体的には、eFile フォルダの Excel Book（test.xlsm）をコピーして、クラス別（AHR.xlsm）に名前を変えて MS_Reader.exe がある場所に保存。採点結果もコピーした Excel Book（AHR.xlsm）に書き込みます。さらに、この作業はすべてプログラムから自動実行します。

採点者は、採点結果が書き込まれた Excel Book（AHR.xlsm）を開いて、「名票への貼付元名票」シートに用意した氏名データから「A組の受験者の氏名データ（クラス・出席番号・氏名・ふりがな・性別）を範囲選択してコピーし、「名票」シートに値のみ貼り付けます。

こうすることで同じ内容のファイルを複数個準備することなく、言わば「採点原本」として利用する Excel Book を１つ作成するだけで、試験を実施した全クラス分の採点が可能となります。

ここでは「クラス」と表現しましたが、用意する氏名データを適宜変更すれば「講座」等の採点もまったく同じように行えます。※ プログラムの仕様としては、１回の採点作業で採点する人数を100名以下と想定していますが、実際の採点作業は１採点40名程度で行っています。ですので、40名程度を１つのまとまりとして採点していただく方向でお考えください。

【正解を入力】

氏名データの準備が完了したら、「正解」シートをクリックして表示し、設問毎に「正解」の選択肢の番号を入力します。設問がない場合（無解答でよい設問番号の欄）は空欄のままにしておきます。入力したら、入力内容に間違いがないか、よく確認し、上書き保存してください。

正解の入力を間違えるとたいへんなコトになります！
慎重に入力し、最低２回は間違いがないことを確認してください。

【配点を入力】

次に、「マークシート配点」シートをクリックして「配点」を入力します。入力と同時に合計が自動的に計算されます。入力が完了したら上書き保存してください。なお、この配点表の下には観点別評価の表もありますが、この表には一切入力しないでください（観点別評価の表は入力禁止です）。

【観点別評価の区分を入力】

次に、「マーク＆手書き観点別評価」シートをクリックして「観点別評価の区分」を入力します。
「知識・技能 ⇨ １」、「思考・判断・表現 ⇨ ２」として設問毎に、半角数字で入力してください。デフォルト設定では、すべての設問に「１」が入っています。解答を要しない設問は「空欄」にしてください。入力したら上書き保存します。

以上で、試験実施前の準備は終了です！

９．Excel Book への書き出し

重要　すべての Excel Book を閉じてから実行してください！

危険　Excelが起動した状態で実行すると重大なエラーが発生します！

Excel へデータを書き込む際は、上記注意事項を必ずお守りください。この注意を忘れて Excel が起動したまま、Excel Book への書き込みを実行すると最悪の場合、Excel のプロセスが幽霊のように残り、これを終了することが出来なくなって、復旧するには、システムの再起動しかない状態になります。未保存の重要なデータがあるような場合、当然そのデータは失われます。Excel Book へのデータ書き込み時は、Excel が起動していないことを（タスクバーに眠っている Excel Book がないことも含めて）十分確認した上で、書き込み作業を行ってください。

【書き出し処理】

マークシートを読み取り後、読み取り結果のチェックまで完了したら、Excel Book への読み取り結果の書き出しが可能となります。次のようにマークシートリーダーを操作してください。

最初に、ファイルへ出力の Excel のオプションボタンをクリックして選択します。すると、その右側にある「選択」ボタンがクリックできるようになりますから、このボタンをクリックしてください。

ファイル選択のダイアログが表示されますので、読み取り結果を書き込む Excel Book をクリックして選択し、その後、下にある「開く」ボタンをクリックします。Pathの指定は、デフォルトで eFile フォルダになっています。準備作業で作成した test.xlsm を eFile フォルダに保存したのは、この読み取り結果を書き込む Excel Book を選択する作業を円滑に実行するためです。

次のメッセージが表示されます。

重要　ここで Excel が起動していないことを必ず確認してください！

選択した Excel Book が書き込み先として表示されていることを確認し、「書き出し」ボタンをクリックします。

書き込みには、しばらく時間がかかります。次のメッセージが表示されるまでお待ちください。

すぐに書き込み結果を確認する場合は、「はい」をクリックします（ここでは「はい」をクリックしたものとして説明を続けます）。

「はい」をクリックした場合は、エクスプローラーが自動的に開きます。先ほど選択した「test.xlsm」のコピーが「Scanner_A.xlsm」として、eFile フォルダではなく、MS_Reader.exe のあるフォルダに生成されています。

ファイル名がなぜ「Scanner_A.xlsm」になったかというと、マークシートの読み取り元フォルダとして選択したのが、ProcData\Scanner_A であったためです。プログラムは、マークシートの読み取り元フォルダの名称をそのまま、原本「test.xlsm」をコピーして生成する読み取り結果書き込み先 Excel Book の名称として利用します。

マークシートの読み取り元フォルダの名称が、Excel Book の名称になります！

マークシートの読み取り元フォルダの名称が「R05_情報Ⅰ_1A」であれば、MS_Reader.exe のあるフォルダに「R05_情報Ⅰ_1A.xlsm」が生成されます。

ここは、この仕様に慣れるまで混乱が生じやすいところと思われます。しかし、この仕様（仕組み）を十分に理解して、マークシートリーダーを使いこなしている職場の同僚からは「よく考えられた採点システムだと思います」と言ってもらえました。うれしかったなー！！

【成績一覧表の印刷】

生成された Excel Book をダブルクリックして起動します。起動したら「名票への貼付元名票」タブをクリックして開き、採点対象クラス（等）の氏名データを範囲選択してコピーし、「名票」タブをクリックして B3 セルに値のみ貼り付けます。次に「採点」タブをクリックしてください。次のような画面が表示されます。「氏名がある場合のみチェックする」ボタンをクリックしてください。画面上方に表示されている平均点が正しく再計算されます。なお、欠席者の得点は「０」と表示されていますので、この場合は手動で「受験確認」のチェックを外し、平均点の計算対象から除外してください。

このシートは通常の印刷操作で印刷できます。ただし、デフォルト設定で100名分を２枚に分けて印刷する仕様となっているため、成績一覧表が１枚でよい場合は、次のように指定して１ページ分のみ印刷を実行してください。

【観点別評価を行う場合】

観点別評価を行う場合は、「正答率」タブをクリックして、上と同様の操作を行ってください。欠席者がいた場合の処理も同じです（このシートは印刷しません）。

【個票の印刷】

最後に、試験の採点結果を受験者に知らせる成績個票を印刷します。よー書いた。さすがに私も疲れました。あと、もぉちょっとです！

「個人表」タブをクリックします。次のような画面が表示されます（表示倍率は異なります）。まず、考査名と科目名を入力してください（忘れやすい部分です！ご注意願います）。印刷はVBAでマクロを組んであります。設問数に合った「印刷（QXX）」ボタンをクリックしてください。

重要　セルを保護していません。誤って式を消さないでください！

次の印刷フォームが表示されます。開始番号と終了番号を入力し、「印刷実行」をクリックします。

重要　印刷は途中で中止できません！

VBAではプログラム書いてない！のに、Engterキー押し下げでフォーカスが移動します･･･

この印刷は Excel の仕様上、印刷データをためてからイッキにプリンタへ送信という方法が取れません。１枚ずつ送信しますので、ちょっとギクシャクした感じで印刷が実行されます。プリンタが壊れているわけではありません。

【個票を個別に確認したい場合は？】

受験者個々の個票を確認したい場合は、A2 セルに「採点」シートの通番を入力します。いろいろなクラスの生徒が混在した講座の処理に対応するため、入力値は「出席番号とは異なる」ことにご注意願います。

個票を確認したい受験者の通番は「採点」シートを表示して確認してください。

【壊しちゃったときは？】

個人表シートを壊してしまった時は、次のようにすれば直せます。「個人票_Back」タブをクリックします（このシートは絶対に非表示にしないでください）。A 列の左、１行めの上（図の〇印を付けた部分）を右クリックしてシート全体を選択し、表示されるサブメニューのコピーをクリックします。

個人表シートに戻って、先ほどと同じ A 列の左・１行目の上を右クリックして表示されるサブメニューの「数式fx」をクリックします（罫線データ等を壊してしまった場合は、すべてを貼り付けます）。

数式が壊れた場合は数式を貼り付けます。
面倒な場合は、いちばん左の全部「貼り付け」でもOK！

１０．マークシート印刷用紙について

紙の「白さ」の度合いを「白色度」というそうです。このマークシートリーダーで読み取りに使用したマークシートはすべて「再生紙 or 再生コピー用紙」と呼ばれる紙に印刷したものです。

ですから、ここで紹介したマークシートの読み取り結果は、すべて「白色度70％」前後の「再生紙」に印刷してのもので、ホームセンターで一般的に販売されているような「白色度」が「再生紙」よりはるかに高い「真っ白に見える」用紙を用いての読み取り結果ではないことに、十分ご注意願います。

マークシートの印刷に使用する紙の「白色度」によっては、読み取りパラメータ設定の見直しが必要になるかもしれません（私自身は、実験・試行していませんので正確なことはわかりませんが）。入手可能なすべての紙について、実験することは現実的に無理でありますので、マークシートを印刷する用紙については、本ソフトウェア使用者の責任で十分な試行を行い、確実に動作するパラメータ設定を行った上で、このプログラムをお使いいただけますよう、お願いいたします。

印刷はインクジェットプリンタで行うことを推奨しましたが、長期にわたって使用していない（メンテナンスもしていない）インクジェットプリンタ（複合機）では、インクの吸い込みに問題が生じ、「いくら調整しても・何度クリーニングを行っても」期待した濃度での印刷ができないということも経験しました。サービスマンの方に伺ったところ、「こういう状態になると通常のクリーニングではなかなか復旧しない」と教えていただき、あらためて日常的に使用してインクを動かすことと、不具合が見えたらすぐにメンテナンスをお願いすることの大切さに気づいたこともあります。

そのサービスマンの方からは、マークシートに付着していた消しゴムの「屑」がスキャナーのローラー等可動部の動きを悪くして、マークシートがやや斜めにスキャンされたりする原因となり得ることも教えていただきました。実際に大量のマークシートを読み取ってきた複合機のスキャナー部分からは、かなりの量の消しゴム屑が･･･。受験者には消しゴム屑をよーく落としてから答案（マークシート）を提出するよう注意しておく必要があります。まさに塵も積もればなんとやら･･･です。

また、ご使用のスキャナーの読み取り設定によっては（デフォルトの読み取り設定が）0～255段階のグレースケールでなく、カラーであったり、ある閾値で白黒二値化しての読み取りであったりという、私の想定外の設定であることも、当然のようにあり得ると思います。それがカラー画像であった場合の影響はほとんどないと思われますが、ある閾値での白黒二値化画像であった場合は、判定に重大な影響を及ぼす可能性があります。ですので、マークシートの読み取りに、使用されるスキャナーの読み取り設定に関して、予め、使用者様の責任で十分ご確認いただけますよう、併せてお願い申し上げます。

１１．まとめ

このマークシートリーダーで出来ること、出来ないことをまとめました。

【出来ること】

・マークシートのJpeg画像を回転＆適切なサイズに縮小
・マークシート画像のマーク読み取り（１設問当たり最大16選択肢まで対応）
・読み取り結果の確認（GUI & 音声出力）
・読み取り結果のCSVファイル出力
・読み取り結果を採点結果通知用Excel Bookへ出力（新教育課程に対応）
・共通テスト形式の数学試験に対応（選択肢：-、±、0-9、記号：a～d）※ 後日掲載します。
・共通テスト形式の情報Ⅰ試験に対応（選択肢：０始まりの設定も可能）※ 後日掲載します。
・使用環境に合わせて各種パラメータ設定を変更可能
　⇨ ScanSnap iX1500のノーマルモード（解像度150dpi相当？）、もしくはEPSON PX-M7110F（解像度200dpi）でスキャンしたJpeg画像のマーク読み取りに最適化した値をデフォルト値に設定済み。

【出来ないこと】

・１設問について、複数の解答が設定された採点
・前問の解答内容に応じて、次の問いの解答が変わる採点
・その他、答案１枚のみの採点等、このプログラムで想定外の採点全て
・１回の読み取り操作で処理できるJpeg画像は99枚までで、100枚を超える枚数は処理できません。

【その他の使用方法】

MS_Reader.exe の「ヘルプ」にある「PDFを表示」をクリックすると利用方法の手引きがお使いのPDFリーダーで表示されます。マークシートの作り方等、このブログの記事にないことも書いてありますので、必要に応じてこちらも併せてご参照いただけますよう、お願いいたします。

１２．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。ここに記載した内容及びダウンロードしたプログラムを利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

Recognize handwritten katakana characters No,2

手書きカタカナ文字をPCに認識させる（その②）

前回の記事では、ETL文字データベースのカタカナ５文字（アイウエオ）＋独自に収集した手書きカタカナ文字（アイウエオ各450～650文字）を元に機械学習で作成した学習モデルを用いて、答案の解答欄に書かれた手書きカタカナ１文字（ア～オのいずれか）の識別に挑戦。自分なりに最善を尽くしたと判断した段階での実際の正解率は91％･･･。

今回は、前回とは別の方法で再チャレンジ。前回と同じデータでテストして、正解率95％を達成。自分で言うのもなんだけど、これなら自動採点も可能なんじゃないか･･･と。

【今回の記事の内容】

１．分類器を検索
２．Lobeを使う
３．tflite形式で書きだす
４．書きだしたtfliteファイルをDelphiで･･･（泣）
５．Pythonで再チャレンジ
６．正解率95％！
７．まとめ
８．お願いとお断り

１．分類器を検索

どうしても手書き答案の自動採点をあきらめきれない僕は、昨日も「Delphi　分類器」をキーワードにGoogle先生にお伺いをたてた。実は「分類器」なる言葉を知ったのは最近のことで、これまで機械学習関連の検索キーワードとしてこの言葉を使ったことがなく、これでヒットするページは「ほぼ既読のリンク表示にならない」ので、当分の間、このキーワードで情報を得ようと考えたのだ。

また、Pythonではなく、Delphiとしたのは、2022年の年末からほぼ1か月間、Python関連の機械学習（ライブラリはTensolflowとkerasを使用・言うまでもなくスクリプトはもちろん、ほぼ全部写経！）で手書き文字の自動採点を実現しようと試みたが、どう頑張っても期待したような結果が出せず、とりあえずPythonスクリプト以外の「新しい情報」が「もしあれば」そちらも探してみようと思ったのだ。新しい情報があって、それがDelphi関連なら、すごく･･･うれしいから。

で、検索すると次のページがトップに表示された。

Tensorflowで数字の分類器を構築する方法
https://blogs.embarcadero.com/ja/how-to-build-a-digit-classifier-in-tensorflow-ja/

「著者： Embarcadero Japan Support　 2021年11月09日」ってコトは･･･

（へぇー！ DelphiでもMNISTできるんだ。知らなかったー！！）

（しかも、日付がどちらかと言えば最近！）

急に興味関心が湧いて、しばらく記事を読んでみる。記事によれば、現在 TensorFlow LiteがDelphiで利用可能とのこと（気分的には TensorFlow Super Heavy の方がマッチするんだけど、残念ながらそれはないようだ）。４年前にPythonでやったのと同じ、マウスで画面に数字を書いて、それが０～９の何なのかを判定するプログラムの画像が掲載され、「プロジェクト全体をダウンロードしてテストすることができます。」とある。

（なつかしいなー　あの時はGUI作りにPyQtを使って･･･　動かすのに苦労したなー）

（今は数字じゃなくて、オレ、「ア」って書きたいんだけど･･･）

（･･･てか、肝心の学習モデルはどうやって作ってるんだろう？）

なんだかドキドキしてきた！
ページのいちばん下には「下記のリンクにアクセスしてサンプルコードをダウンロードし、実際に試してみてください。」という、うれしい案内が。

思わず、小学生のように、笑顔で、元気よく、「はぁーい」と答えたくなる。

（ MNISTは別にして、学習モデルだけでもどうなってるか、確認してみよう･･･）

結果的には、これが大正解。その存在すら知らなかった「Lobe（ローブ）」に巡り合うきっかけになろうとは･･･。

早速、リンク先からサンプルコードをダウンロード･･･

できませんでした（号泣）

404 This is not the web page you are looking for.

僕の人生は七転八倒。こんなコトには慣れっこさぁ T_T

こんなときのラッキーキーワードはもちろん「 TensorFlow-Lite-Delphi 」
Google先生、たすけてー！

今度は見事にヒット！

Embarcadero / TensorFlow-Lite-Delphi Public archive
https://github.com/Embarcadero/TensorFlow-Lite-Delphi

DLも無事成功！　プログラムソースの学習モデルの指定部分を探すと･･･

//DCUnit1.pasより一部を引用

procedure TForm1.Recognize;
var
  i, X, Y: DWORD;
･･･
begin
  try
    var fModelFile := 'mnist3.tflite';
    case rdModel.ItemIndex of
      0: fModelFile := 'mnist.tflite';
      1: fModelFile := 'mnist1.tflite';
      2: fModelFile := 'mnist2.tflite';
      3: fModelFile := 'mnist3.tflite';
    end;

fModelFileとあるから、まずコレが学習モデルの代入先で･･･
んで、入れてるのが『mnistX.tflite』？？？　あんだ？　コレあ？

拡張子 tflite から想像して、学習モデルは TensorFlow Lite で作成したモノのようだ･･･
Pythonの機械学習では見たことない気がするけど。

もし、この tflite 形式で、手書きカタカナ文字の学習モデルが作成できれば･･･
お絵描き部分は、共用可能だから･･･
マウスで「ア」って書いて、PCに「これ、なぁーに？」って！！　きけるカモ ↑

コレだ。コレだ。コレだ。コレだ。コレだ。僕は、コレを待っていたんだ！！

即、Google先生にお伺いをたてる。

「Delphi　tflite　書き込み」　ポチ！

すると、検索結果の上から３番目くらいに、

[Lobe] Lobeで作成したモデルをTensorflow Lite形式で …

というリンクを発見。

（ Lobeってナンだか知らんけど、これで学習モデルが作れる･･･のかな？）

（で、Tensorflow Lite形式でモデルの保存ができるの･･･かな？）

とりあえず、クリックだぁ！！

*(^_^)*♪

２．Lobeを使う

リンク先の記事・その他を読んでわかったことは、まず、Lobeは「Microsoftによって公開されている機械学習ツール」であるということ。

Lobe公式サイト
https://www.lobe.ai/

さらにそれは、無料でダウンロードでき、しかも完全にローカルな環境で、コードを１行も書かずに機械学習を実現する、夢のような分類器（ツール）らしい。

（こんなのがあったのか！　まるで知らなかった･･･）

Lobeの使い方を紹介したWebサイトの記事を片っ端から読んで、だいたいの作業の流れを理解。次に示すような感じで、自分でも実際にやってみた。

Lobeを起動して、まず、タイトルを設定。

importするのは、もちろん画像なんだけど･･･

Datasetの説明に Import a structured folder of images. とあるから、これはつまり、「ア」の画像データは、それだけをひとつのフォルダにまとめておけば、フォルダ名でラベル付けして、それをひとつのデータセットとして読み込んでくれるってコト？

「ア」を入れるフォルダ名は、最初「ａ」にしようかとちょっと思ったけれど、そうすると昇順の並びが「ａｅｉｏｕ」になることを思い出し、躊躇。

やっぱり、ここは、後できっとLoopを廻すであろうことを予想して、

「ア」→フォルダ名「０」
「イ」→フォルダ名「１」
「ウ」→フォルダ名「２」
「エ」→フォルダ名「３」
「オ」→フォルダ名「４」

とすることに決定。

モノは試し、最初は様子だけ見てみようということで、データセットはとりあえず自分で集めた手書き文字だけにして実験することに決めたんだけど、ここでデータセットの整理を思い立つ。

･･･というのは、オリジナル手書き文字画像データを作る際に、元の画像から切り抜いたカタカナ文字画像をETL文字データベースのETL1及びETL6の画像サイズに合わせ、幅64・高さ63に成形するPythonのスクリプトを書いたんだけど、その中にはガウシアンフィルタをかけても取り切れないようなシミや黒点がある画像がかなりあること（汚れがすごく目立つ画像は、ひとりで大我慢大会を開催し、「これは修行なんだ」と自分に言い聞かせて、１枚ずつペイントでそれなりにキレイにしたんだけど、それでもまだ汚れの目立つ画像がいくつも残っていた）。

ただ、文字情報とは関係のない黒い点なんかは、多少あった方が過学習を防止するのに役立つカモ（？）という観点から、小さなシミのある画像は敢えてそのままにしたものもそれなりにある。このへんは画像を見た感じでテキトーに判断（理論的なコトは勉強していないので、まったくわかりません）。

それと最初に書いた画像成形のスクリプトが不完全で文字の一部が欠けてしまった画像も若干含まれていることなど、今、ちょっと冷静になって振り返ってみると、自分では慎重に処理を進めてきたつもりでも、やはり無我夢中でやってると、その時々は気づかなかった「さらに良くすることができた・より良くすべきだった」見落としがポロポロあり、ここで、ようやく僕は、見落とし箇所の改善を思い立ったのだ。

例えば･･･シミや汚れ取りは（ある文字の一部を部分的に拡大）

※ 実際には、この程度のシミと汚れは過学習防止用に敢えて残した画像も多数あり。

機械学習の事前準備処理の中で、学習用データとして使用する画像に、ガウスぼかしをかけたり、二値化したりして、上の左の画像に見られるようなごく薄い汚れは自動的に消えるから、すべての画像について徹底的にクリーニングする必要はないと思うのだけれど、ただ、明らかに濃度の高いシミ等は、なるべく消しておいた方が真っ白な気持ちで学びを開始するキカイに、少しはやさしいかな･･･みたいな気もするし *^_^*

反面、学習させたいデータ（例えば「ア」）とは直接関係のない黒いシミがある画像が多少は混じっていたほうが、過学習が起こりにくいのかなー？みたいな気もするし･･･

パラメータが利用できる場合は、ドロップアウトを何％にするかで、そういうことも含めて調整できるのかなー？みたいな気もするし･･･

ちゃんと勉強しなさい！という
神さまのドデカイ声が、力いっぱい
聴こえるような気もするケド･･･

『いったい、何が幸いするのか』まったくわからん。機械学習はほんとに難しい･･･などと、イロイロ考え（自分を誤魔化し）ながら、極端に大きなシミがある画像はとりあえずクリーニングし、また、これは不要と思われる文字（例：崩しすぎた文字、極端に小さな文字、ぼやけ・かすみの激しい文字等）を「テキトー」に削除した結果、ア～オ各文字のデータ数にばらつきが生じてしまった･･･。

たしか、MNISTだって各数字の総数はそろってなかったような気がするけど、今、僕が用意できたデータはMNISTの約1/100しかないから、質はともかく量的には明らかに不足しているはず･･･

今、手元にあるデータの数は･･･

ア：641
イ：653
ウ：652
エ：459
オ：575

「エ」がちょっと少ないのが気になると言えば、気になるけど、これしか集められなかったんだから仕方ない。せっかく集めたデータを利用しないのは嫌だし･･･。とりあえず、各文字の個数を水増しスクリプトで700に統一しようか･･･

データの水増しに使用するPythonスクリプトは、次のWebサイト様の情報を参照して作成じゃなくてほぼ写経（Pythonスクリプトの全容は、引用させていただいたWebサイト様の情報をご参照ください）。

ImageDataGenerator
https://keras.io/ja/preprocessing/image/#imagedatagenerator

薬剤師のプログラミング学習日記
https://www.yakupro.info/entry/digit-dataset

# ライブラリのインポートとパラメータの設定部分のみ
# Error
# from keras.preprocessing.image import ImageDataGenerator, load_img, img_to_array
# OK!
from keras_preprocessing.image import ImageDataGenerator, load_img, img_to_array

if __name__ == '__main__':
    generator = ImageDataGenerator(
        rotation_range=3,  # ランダムに回転する回転範囲
        width_shift_range=0.1,  # 水平方向にランダムでシフト(横幅に対する割合)
        height_shift_range=0.1,  # 垂直方向にランダムでシフト(縦幅に対する割合)
        #zoom_range=0.1,  # 文字のハミ出しを防止するため設定せず
        shear_range=0.5,  # 斜め方向に引っ張る
        fill_mode='nearest',  # デフォルト設定（入力画像の境界周りを埋める）
    )

    sample_num = 700   # 各ラベルの画像がこの数になるよう拡張する

これでア～オの各文字約700個ずつのデータセットができた！

Lobeを起動し、ImportからDatasetを選び、０（アが入っている）～４（オが入っている）のフォルダの親フォルダを指定する。

で、画像を Import すれば、あとは何にもしなくても、勝手に学習が始まるようだ。わずか（？）3500個のデータであるが、それなりに処理時間は必要（読ませた画像のサイズは幅64×高さ63で統一）。他のことをしながら処理が終わるのを待ったので、実際に何分かかったのか、定かではない（20～30分くらいか）。気がついたら終わっていた感じ。

表示が Training ⇨ Train になったら、終了 らしい。

学習結果は、次の通り。

自動で分類できなかった文字は、ラベル付けして再学習も可能なようだが、今回はLobeが自動認識できなかった文字はそのままにして先へ進むことにした。

･･･と言うか、自動認識できなかった文字をクリックしてなんかテキトーにいじったら、その文字だけでなく、他の文字の処理も再び始まり（Train ⇨ Training に変化）、99％だった進行状況を表す数値がいきなりガクンと低下して、84％とかになってしまった。

自動認識できなかった文字は１％と言っても、数にすれば約30個あるから、その全てをこんなふうに再学習させたら、間違いなく日が暮れてしまう･･･。中には「コレがアなら、７も１」、「雰囲気が『ア』ですー」みたいな文字も混じっているから、先へ急ぎたい僕は（本格的な再学習は次の機会に行うことにして）学習モデルの書き出し処理を優先することにしたのだ。

３．tflite形式で書きだす

Training が完了したら、次のように操作して学習モデルを tflite 形式で書き出し。

なんか、ものすごくかんたんに、tflite 形式で学習モデルができちゃったけど。
これでイイのかなー？？？

それから、ちょっと気になったので、tflite_example.py の内容をエディタでチラ見。

# tflite_example.pyの一部を引用

if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Predict a label for an image.")
    parser.add_argument("image", help="Path to your image file.")
    args = parser.parse_args()
    dir_path = os.getcwd()

    if os.path.isfile(args.image):
        image = Image.open(args.image)
        model = TFLiteModel(dir_path=dir_path)
        model.load()
        outputs = model.predict(image)
        print(f"Predicted: {outputs}")
    else:
        print(f"Couldn't find image file {args.image}")

outputs = model.predict(image) ･･･ってコトは、学習モデルにイメージ（＝画像）を predict（＝予測）させ、outputs に代入（＝出力）してるから、

うわーすごいおまけがついてる！

コレもあとから試してみよう！

※ 自分の中では、tflite形式で出力された学習モデルをDelphiから直接呼び出して文字認識を実行する方が、この時はあくまでも優先でした。

４．書き出したtfliteファイルをDelphiで･･･（泣）

早速、出来上がった（書き出された） saved_model.tflite ファイルを、DelphiのDebugフォルダにコピー。

saved_model.tfliteファイルの表示部分までの切り抜き（この他にもファイルあり）

んで、コードを書き替えて･･･

//コードを書き換えた部分
procedure TForm1.Recognize;
var
  ･･･
  //fOutput: array [0 .. 10 - 1] of Float32;
  fOutput: array [0 .. 5 - 1] of Float32;
  ･･･
begin
  ･･･
  try
    {var fModelFile := 'mnist3.tflite';
    case rdModel.ItemIndex of
      0: fModelFile := 'mnist.tflite';
      1: fModelFile := 'mnist1.tflite';
      2: fModelFile := 'mnist2.tflite';
      3: fModelFile := 'mnist3.tflite';
    end;}
    var fModelFile := 'saved_model.tflite';
    case rdModel.ItemIndex of
      0: fModelFile := 'saved_model.tflite';
      1: fModelFile := 'saved_model.tflite';
      2: fModelFile := 'saved_model.tflite';
      3: fModelFile := 'saved_model.tflite';
    end;

この他には、関係ありそうな箇所は見当たらないから、きっとこれで準備OK！ *^_^*

実行して、「ア」の上の「つ」部分を描いたところでマウスの左ボタンを離す･･･と、

うわーん！（ T_T ）

君の見ている風景は･･･
どこまでも　すべてが　涙色

君を悲しませるもの
その理由は　もう　聞かないよ･･･

それでも僕は･･･
Delphi　きみが大好きだ！

※ ファイルどうしの依存関係とか、よくわからんけど、もしかしたらそれがあるカモと考え、saved_model.tflite と同じフォルダに書き出されてた labels.txt や signature.json もDebugフォルダ内へ全部コピーして実行しても同じ結果でした。

イロイロ調べてみると、tflite 形式のファイルにもイロイロあるようで･･･

同じ .tflite のファイルでも違いがいろいろ：メタデータまわりについてTeachable Machine、Lobe、TensorFlow Hub等で出力した画像分類用のものを例に
https://qiita.com/youtoy/items/e58c02c1e32c56358d03

たぶん、saved_model.tflite と同じフォルダに書き出されてた labels.txt や signature.json の内容が tflite ファイル内に必要なんじゃないかなー。よくわかんないけど。

tfliteファイルを編集する知識なんて、僕にあるわけないし･･･
（ちょっと調べてみたら、PythonでTF Lite SupportのAPIを利用して、ラベル等の情報をtfliteファイル内に追加することができるようなんだけど、回り道が長すぎる気が･･･）

いずれにしても、どこかしら邪な、このチャレンジは失敗。

 ちなみに labels.txt の内容は･･･

0
1
2
3
4

ちなみに signature.json の内容は

{
  "doc_id": "9276cb74-46aa-435d-9edd-c0dcfa978a77", 
  "doc_name": "aiueo", 
  "doc_version": "fb48bd091c2950039e3841e1204230f2", 
  "format": "tf_lite", 
  "version": 45, 
  "inputs": {
    "Image": {
      "dtype": "float32", 
      "shape": [null, 224, 224, 3], 
      "name": "Image"
  }
} みたいな感じで、よくわかりません（以下、略）

５．Pythonで再チャレンジ

Delphiで tflite ファイルを直接読み込んでの文字認識に失敗して、すぐに思い出したのは先に見た『 tflite_example.py 』

PythonのスクリプトをDelphiのObject Pascal に埋め込んで実行することなら僕にもできるから、tflite_example.py で学習モデルがまだ見たことのないカタカナ文字画像の認識に成功すれば、最終的な目標の実現は可能だ。

すごいまわり道になりそうだけど、Delphiから直接読み込めるように tflite ファイルを編集する方法だってまだ残されている。ただ、僕はものごとを理解するのが遅く、学習には普通のヒトの何倍もの時間が必要だから、これはいよいよとなった時の最終手段だ。

SDカードに入れたWinPythonとAtomエディタで、僕は持ち運べるPython実行環境を作っている。Atomが開発中止になってしまったのはちょっとイタいけど、取り敢えずPythonスクリプトを書いて、実行するのに今のところ何ひとつ不自由はない。そのSDカードへLobeが書き出したファイルをフォルダごとコピーする。

Atomを起動。今、コピーしたexampleフォルダを開く。オリジナルの tflite_example.py をコピーして tflite_example2.py を作成。Atomに入れたパッケージ「script」から実行できるようにスクリプトを少し変更。exampleフォルダ内に次の画像を用意して･･･

スクリプトをクリックしてアクティブにしておいて、Shift + Ctrl + B で実行･･･

# 実行結果

Predicted: {'predictions': [
{'label': '0', 'confidence': 0.9855427742004395}, 
{'label': '3', 'confidence': 0.008924075402319431}, 
{'label': '1', 'confidence': 0.005291116423904896}, 
{'label': '4', 'confidence': 0.00012611295096576214}, 
{'label': '2', 'confidence': 0.0001159566527348943}]}
[Finished in 14.759s]

学習モデルが予測したラベルは「０」つまり「ア」、信頼性は９９％！
やった。成功だ。待ちに待った瞬間が、ついに訪れた･･･　ありがとう　Lobe！

次々に画像を変えて実験。

# 実行結果

Predicted: {'predictions': [
{'label': '1', 'confidence': 0.8973742723464966}, 
{'label': '4', 'confidence': 0.10129619389772415}, 
{'label': '2', 'confidence': 0.0012468534987419844}, 
{'label': '3', 'confidence': 4.6186032705008984e-05}, 
{'label': '0', 'confidence': 3.642921365099028e-05}]}
[Finished in 3.313s]

# 実行結果

Predicted: {'predictions': [
{'label': '2', 'confidence': 0.9924760460853577}, 
{'label': '1', 'confidence': 0.0038044601678848267}, 
{'label': '0', 'confidence': 0.0017367065884172916}, 
{'label': '3', 'confidence': 0.0010746866464614868}, 
{'label': '4', 'confidence': 0.0009080663439817727}]}
[Finished in 13.591s]

# 実行結果

Predicted: {'predictions': [
{'label': '3', 'confidence': 0.9999231100082397}, 
{'label': '1', 'confidence': 7.657476089661941e-05}, 
{'label': '4', 'confidence': 2.250336166298439e-07}, 
{'label': '0', 'confidence': 7.755971154210783e-08}, 
{'label': '2', 'confidence': 6.385280215681632e-08}]}
[Finished in 15.323s]

# 実行結果

Predicted: {'predictions': [
{'label': '4', 'confidence': 1.0}, 
{'label': '3', 'confidence': 1.7214372288743007e-11}, 
{'label': '1', 'confidence': 4.185582436200264e-12}, 
{'label': '0', 'confidence': 8.478809288784556e-14}, 
{'label': '2', 'confidence': 4.801435060631208e-14}]}
[Finished in 13.506s]

すべて、正解･･･

なんだか、こころがカラッポになった。
そう、夢が叶う瞬間は、いつも･･･

６．正解率95％！

チャレンジの総仕上げとして、前回の実験では正解率９１％だった手書きカタカナ「アイウエオ」画像37セットをLoopで判定し、認識結果を「アイウエオ」で出力できるよう、スクリプトを準備。

結果を信じて、実行。

# 実行結果

ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
イ：×
イ：〇
エ：×
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
イ：×
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
イ：×
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
イ：×
エ：〇
オ：〇
ア：〇
イ：〇
エ：×
エ：〇
オ：〇
エ：×
イ：〇
ア：×
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
ア：〇
イ：〇
エ：×
エ：〇
オ：〇
ア：〇
イ：〇
ウ：〇
エ：〇
オ：〇
[Finished in 18.27s]

正解率をExcelで計算。

手書きアイウエオ画像185枚のうち、176枚を正しく認識できた。
これなら、自動採点に使える。
とうとう、やった。

夢の実現へ、大きく一歩を踏み出せた！

７．まとめ

無料で利用できるOCR技術を利用した手書き文字認識は、自分が試した範囲では、現状まだ実用には程遠い感触であった。

そこで、次に、手書き文字の座標を輪郭検出で取得し、文字を矩形選択して、解答欄のスキャン画像中から切り抜いて画像データ化、Web上に大量に情報が溢れているPythonライブラリ（TensorFlow＋keras）を使用した機械学習で処理して学習モデルを作成（読み取り対象文字はアイウエオの５文字に限定）、この学習モデルを使っての文字認識にチャレンジしたが、学習データ数及びパラメータ設定を様々に工夫しても実際の検証データに対する正解率は９１％より上昇することはなく、最終的な目標としていた自動採点に繋げることはできなかった。

そこで、今回は情報の収集範囲を広げて再チャレンジ。Lobeという分類器の存在を知る。このLobeに約３５００枚（総文字数）の手書きカタカナ画像を読ませて tflite 形式の学習モデルを作成。これに前回の実験で使用したのと同じ手書きカタカナ文字（アイウエオの５文字 × ３７セット＝１８５枚）を見せたところ、９５％の文字を正しく認識することができた。

この結果より、今後、より多くの良質な機械学習用手書き文字画像を集め、Lobeを利用して全自動で学習モデルを生成、さらにLobeが自動分類できなかった画像の質をチェックし、もし必要と判断される場合はラベル付けして追加学習を行い、より良くトレーニングされた学習モデルを準備できれば、最終的に人が必ずチェックするという条件の元で、機械と協働しての答案の自動採点は十分可能であると、僕は感じた。

なぜ、それを実現したいのか？
僕の中で、その理由はひとつしか、ない。
地位も、名誉も、富も、その前で、輝きを失う言葉に、僕は巡り合えたからだ。

The purpose of life is to contribute in some way to making things better.
人生の目的は、ものごとを良くすることに対して何らかの貢献をすることだ。

Robert F. Kennedy

DelphiやPythonと力を合わせれば、夢見たことを実現できる。そして、僕がひとりで夢見たことが、本当に、本当になったとして、それが僕自身だけでなく、偶然でもかまわないから･･･、知らない人でもいい、僕でない、他の誰かのために、もし、役立ったなら･･･、その時、こんな僕の拙く幼い学びにも、そこに、初めて「意味」や「価値」が生まれるんだ、と･･･。僕は本気で、そう信じている。

採点プログラムへのチャレンジは、再生紙に印刷したマークシートを、複合機のスキャナーでスキャンして電子データ化、このスキャン画像から、ほぼ100％正しくマークを読み取れるマークシートリーダーを作ることから始まった（完成したプログラムは任意の選択肢数を設定可能な一般用の他、選択肢の最大数を記号－、±、数字０～９、文字A～Dの計16 として「読み取り結果を抱き合わせての採点も可能」な数学採点用途にも対応）。開発当初は読み取りパラメータの最適な設定がわからず、読み取り解像度も高くする必要があったが、最終的にはパラメータ設定を工夫し、職場内の複数個所に設置されている複合機のスキャナーのデフォルト設定である200dpiの解像度で読み取ったJpeg画像でエラーなく稼働するものを実用化できた。これを職場のみんなに提供できた時、僕は本当に、心からうれしい気持ちになれた。人生の師と仰ぐ、ロバート・フランシス・ケネディの言葉をほんの少しだけ、僕にも実践できたかもしれない･･･と、そう本気で思えたからだ。

次に、マークシートとも併用可能な、手書き答案の採点ソフト作りにチャレンジした。最初は横書きの答案から始め、最終的には国語の縦書き答案も採点できるものに仕上げた。採点記号も〇や × だけでなく、負の数をフラグに使うことで、部分点ありの△も利用可能とし、コメント挿入機能や、現在採点している解答を書いた児童生徒の氏名も解答欄画像の左（or 右）に表示できるように工夫した（横書き答案のみ）。もちろん、合計点は自動計算。返却用の答案画像の印刷機能も必要十分なものを実装できた。採点作業が最も大変な、国語科７クラス分の答案を、午後の勤務時間内で全部採点出来たと聞いた時は、胸がたまらなく熱くなった･･･。

その次のチャレンジは、解答用紙の解答欄の自動認識機能の搭載だった。手書き答案採点プログラムを使うユーザーを見ていて、いちばん強く感じたことは、PCに解答欄の位置座標を教えるため、解答欄の数だけ矩形選択を繰り返さなくてはならない採点準備作業を何とかして低減、せめて半自動化できないか･･･ということだった。ここではOpenCVの優秀な輪郭検出器に巡り合い、点線を活用するなど解答欄の作成方法を工夫することで、全自動とまではいかないが、取り敢えず解答用紙中の全矩形の位置座標を自動取得し、必要な解答欄矩形の座標のみ、ユーザーが取捨選択できるプログラムを作成・提供できた。

そして、今、僕は、手書き・カタカナ１文字（アイウエオ限定）の自動採点にチャレンジしている･･･。

Ask and it will be given to you.

この言葉を信じ、失敗の山を築きながら、

次はきっと･･･

誓って自分に言い続けて。

生きるちからを失くしたときが、このチャレンジの終わり。
でも、僕は、僕がこの世から消えたあとも、
動くプログラムを作るんだ･･･

正直、今回、最終的に自分でやったことはアイウエオの画像データの準備だけ･･･みたいな感じになっちゃったけど、結局、Lobeとの出会いがすべてだったけれど、もし、途中で夢をあきらめていたら、絶対にLobeには出会えなかった･･･。

さぁ次はアイウエオ限定の自動採点機能の実装だ。
Delphiが笑顔で、僕を待ってる･･･

８．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。また、本記事内で紹介させていただいた実験結果は、あくまでも私自身が用意した文字データに対してのものであり、別データで実験した場合、同様の結果が得られることを保証するものではありません。

追記

【もくじ】

１．学習＆推論データについて

２．解答欄の切り出し

３．解答欄からの解答の切り出し

４．学習用データを作る

５．学習モデルを作る

６．まとめ

７．お願いとお断り

【もくじ】

１．さらに勉強した理由

２．HOGを知る

３．気分は「写経」

追記_20250421

もっとラクできたかな･･･

別の意味と価値がある

まぁ、全部をまとめて言えば･･･

人生は必ず ± ０になるということでしょうか？

４．今後の抱負

５．まとめ

６．お願いとお断り

正直。うれしいより先に

やばい！

・・・と、思いました。

【もくじ】

１．32ビット版で自動採点機能を搭載できないか？

２．Tesseract-OCR を使う

３．scikit_learnを使う

(1) Embeddable Python へのインストール

scikit-learn です！

(2) 学習モデルを作成して認識テスト

うぎゃ！Zoräth ✷ fel∅, ∞’ka selenïv! ⧖ Trål’xon que！

(T▽T;) やっちまったぁ！！

４．とんでもない認識結果に驚愕する

これなら手書き文字認識に十分、使えるのではないでしょうか？

さぁ AC_Reader の改造だ！

５．まとめ

６．お願いとお断り

追記（20260401）

追記（20240929）

追記（20250913）

追記（20250702）

【追記追加前の記事の本文はここからです！】

【もくじ】

１．最初に作ったのはB4縦型のマークシート

こんなプログラムは使えない！！

２．次に作ったのはA4横型のマークシート

３．Excel でマークシート作成に挑戦

Google先生、ありがとう！

４．マークシートを最適化

５．読み取りプログラムも修正

６．発見した問題点と解決策

７．まとめにならないまとめ

追記 改良したプログラムに更新しました（20240625）

この大語群専用マークシートを使用した試験の実施方法と、試験後の処理方法について次回の記事で詳細を説明する予定です。よろしければ、そちらの記事もご参照ください。

８．プログラムのダウンロード

塗りつぶし形式のマークシートは、解答に時間がかかります！「塗りつぶさないマークシート」の改良版が上記リンク先からダウンロードできます。こちらもあわせてお試しください。

９．お願いとお断り

追記（20260401）

Answer Column Reader

追記（20250825）

追記（20250707）

【もくじ】

１．使い方

（１）zipファイルを展開

（２）プログラムを起動

（３）スキャンした答案の画像を準備

重要 白黒の二値化画像としてスキャンしないでください。

重要 スキャンした画像は、必ず「ScanData」フォルダ内にフォルダを作成し、保存してください。

重要 ScanDataフォルダ内のフォルダに階層構造を作らないでください。

（４）採点用画像の準備

重要 採点用画像には、必ずこの画像変換プログラムが生成したJpeg画像を使ってください。それ以外の方法で作成した画像は使用できません！

重要 ProcDataフォルダ以外の場所は、作業フォルダに出来ません！

（５）解答欄の座標を取得

重要 実際に試験で使用した解答用紙の画像を使用する

重要 採点作業の名称にはクラス名を入れないでください。

重要 RectangleDetector.exeを直接起動しないでください

重要 矩形検出機能はAC_Readerから呼び出して使ってください

重要 ここではフォルダではなく、ファイルを選択します。

重要 実際の試験で使用した解答用紙の画像で作業します。

人生は必ず ± ０になる
ということでしょうか？

これなら手書き文字認識に
十分、使えるのでは
ないでしょうか？

追記　改良したプログラムに更新しました（20240625）

塗りつぶし形式のマークシートは、解答に時間がかかります！
「塗りつぶさないマークシート」の改良版が上記リンク先からダウンロードできます。こちらもあわせてお試しください。

重要　白黒の二値化画像としてスキャンしないでください。

重要　スキャンした画像は、必ず「ScanData」フォルダ内にフォルダを作成し、保存してください。

重要　ScanDataフォルダ内のフォルダに階層構造を作らないでください。

重要　採点用画像には、必ずこの画像変換プログラムが生成したJpeg画像を使ってください。それ以外の方法で作成した画像は使用できません！

重要　ProcDataフォルダ以外の場所は、作業フォルダに出来ません！

重要　実際に試験で使用した解答用紙の画像を使用する

重要　採点作業の名称にはクラス名を入れないでください。

重要　RectangleDetector.exeを直接起動しないでください

重要　矩形検出機能はAC_Readerから呼び出して使ってください

重要　ここではフォルダではなく、ファイルを選択します。

重要　実際の試験で使用した解答用紙の画像で作業します。

参考　横書き答案の場合、解答欄矩形の座標はｘ軸方向については左から右へ、Y軸方向については上から下へという順番で読み取ります。

参考　縦書き答案の場合、解答欄矩形の座標はｘ軸方向については右から左へ、Y軸方向については上から下へという順番で読み取ります。

注意　「追加中」状態で作業しないとエラーが発生します！

重要　横書き答案の採点時のみに利用できる機能です。

重要　「解答欄の高さの最小値を超えない高さ」で範囲指定してください。

重要　左手で入力作業、右手は選択作業（クリックに専念）

・正解〇を入力

重要　最後に「書込」を忘れずにクリックします。

重要　採点しないと定型文入力はできません！

重要　印刷する用紙がA4版であることを確認する

重要　印刷用紙の縦・横指定を答案に合わせて指定する

重要　両面印刷は必ずOFFに設定する

重要　予めsNameフォルダに生徒氏名データを用意しておきます。

重要　講座単位の処理の場合も、講座名等で氏名データを準備しておきます。

重要　氏名データの並び順は、答案の並び順と一致させてください。

重要　マークシートは、解像度150～200dpiでスキャンしてください。

重要　１回の操作で読み取り可能な枚数は最大９９枚です。

重要　フォルダ名にハイフン（-）を使わないでください。

参考　フォルダ名には、文字の他、アンダースコア（_）が使用できます。

重要　解像度150dpi ・A4横置きの場合、リサイズは必要ありません！

重要　解像度200dpi ・A4横置き・解答マーク欄４列の場合、80％の大きさにリサイズしてください。読み取り後のチェックまで含めて、作業しやすくなります。

重要　画像のリサイズの有無を必ずメモ（記録）してください！

重要　大きな解像度の画像を扱う場合、動作速度が大幅に低下します！

重要　ProcData以外のフォルダには画像を保存しないでください。

重要　Python環境を利用する場合はファイル名は必ず連番にしてください。

重要　マークシート左上にマーカー画像（■■■）を必ず用意します。

重要　マーカー画像は、マークシート１枚に１つだけ用意します。

極めて重要　設問番号欄を含めて指定してはいけません！

極めて重要　指定するのはマーク欄のみ！