あるある!住所録の表記ゆれ問題
「あれ、この会社さん2件登録されてる……?」
顧客名簿や取引先リストを整理していて、こんな経験ありませんか?
- 「株式会社ABC」と「(株)ABC」が別々に登録されている
- 「東京都港区六本木1丁目」と「東京都港区六本木1−1」で表記が違う
- 「田中 太郎」と「田中 太郎」でスペースの全角・半角が違う
- 「ヶ丘」と「ケ丘」と「が丘」が混在している
こういった表記ゆれ、手作業で一つずつ直していくのは本当に大変ですよね。100件くらいならまだしも、数千件ともなると気が遠くなります。
実はこの面倒な作業、AIにお願いするとあっという間に片付きます。今回はその具体的なやり方を紹介します!
そもそも「データクレンジング」って何?
難しそうな言葉ですが、やっていることはシンプルです。
データクレンジング = データのお掃除
名簿やリストの中にある、誤字・重複・表記のばらつきを見つけて、きれいに整えること。それだけです。
お部屋の掃除と同じで、普段からこまめにやっておくと後がラクなのですが、気づいたときにはもう手がつけられない……というのもよくある話です。
AIを使った表記ゆれ修正の手順
ステップ1:修正したいデータを準備する
まずExcelやスプレッドシートから、修正したい列のデータをコピーします。たとえば会社名の列だけ、住所の列だけ、といった形でOKです。
一度に渡すのは200〜300件程度がおすすめです。多すぎると処理が不安定になることがあるので、分けて作業しましょう。
ステップ2:AIにお願いする
ChatGPTやCopilotなどのAIチャットに、以下のようなプロンプト(指示文)を送ります。
プロンプト例①:会社名の統一
以下の会社名リストの表記を統一してください。ルールは次の通りです。
- 「(株)」「(株)」は「株式会社」に統一
- 「(有)」は「有限会社」に統一
- 全角スペースは半角スペースに統一
- 前後の余分なスペースは削除
修正前と修正後を表形式で出力してください。
(ここにデータを貼り付け)
プロンプト例②:住所の統一
以下の住所リストの表記を統一してください。ルールは次の通りです。
- 数字は全て半角に統一
- 「丁目」「番地」「号」はハイフン(-)に統一
- 都道府県名が省略されている場合はそのまま
修正前と修正後を表形式で出力してください。
(ここにデータを貼り付け)
ステップ3:結果を確認してExcelに戻す
AIが「修正前→修正後」の対応表を出力してくれるので、内容をざっと確認します。
ここが大事なポイントです。 AIは基本的に正確ですが、たまに意図しない変換をすることがあります。特に以下は要チェックです。
- 固有名詞が勝手に変わっていないか(例:「㈱」が社名の一部の場合)
- 住所の番地が間違って結合されていないか
- もともと正しかったデータが変わっていないか
確認が終わったら、Excelの該当列に貼り付けて完了です!
もっと便利に使うコツ
コツ1:ルールを明確に伝える
「きれいにして」だけだと、AIも何を基準にすればいいか迷います。「株式会社に統一」「数字は半角」など、具体的なルールを箇条書きで伝えるのがコツです。
コツ2:まず10件で試す
いきなり全データを渡すのではなく、まず10件くらいで試して、期待通りの結果になるか確認しましょう。プロンプトの調整が必要な場合も、少量なら手戻りが少なくて済みます。
コツ3:重複チェックも一緒にお願いする
表記ゆれ修正のついでに、「修正後のデータで重複しているものがあれば教えて」とお願いすると、名寄せ(同一人物・同一企業の統合)まで一気にできます。
コツ4:定期作業ならルールを保存しておく
毎月・毎四半期で同じクレンジング作業があるなら、うまくいったプロンプトをメモ帳やドキュメントに保存しておきましょう。次回からはコピペするだけで同じ品質の作業ができます。
どのくらい時短になる?
たとえば500件の顧客リストの会社名統一を手作業でやると、慣れている人でも30分〜1時間はかかります。
AIを使えば、データのコピー&貼り付けと確認作業を含めても5〜10分で終わります。しかも見落としが減るので、品質も上がります。
浮いた時間で、もっと大事な仕事に集中できますね。
まとめ
- 住所録や名簿の表記ゆれ修正は、AIが得意な作業
- プロンプトで具体的なルールを伝えるのがコツ
- まず少量で試してから本番データに適用する
- 結果は必ず目視で確認してからExcelに反映
「データのお掃除」は地味だけど大切な仕事。AIの力を借りて、サクッと終わらせちゃいましょう!