データクレンジング・名寄せとは?
違いやなぜ必要なのかをわかりやすく解説

顧客住所や名前などの連絡先データが統一されていないことで、配送や連絡が遅れたり、精度の高い顧客分析ができないなどで困ったことはありませんか?

データが統一されない原因としては、複数の拠点の担当者がデータ入力を行うことや、顧客自身がデータ入力を行うことで、全角半角やハイフンの有無など、フォーマットや表記などの入力方法が異なることが挙げられます。

このような課題を解決するためには、データクレンジングと名寄せにより、顧客住所や名前などの連絡先データの品質を維持することが必要です。

本ページでは、正確で使いやすいデータを保持するために必要不可欠な「データクレンジング」と「名寄せ」についてわかりやすく解説いたします。

目次

データクレンジングとは?

データクレンジングとは、欠落、重複など、不正確・不完全なデータを特定して修正または削除する処理を指します。

データクレンジングの具体例

住所や名前、電話番号のデータにおけるデータクレンジングの具体例を3つご紹介します。

  • フォーマットの統一(項目の統一)
  • 表記の統一
  • 情報の補完、妥当性の判断

フォーマットの統一(項目の統一)

処理内容 例)処理前 例)処理後
住所の分割 東京都品川区大崎1-11-1ゲートシティ大崎 ウエストタワー22F (都道府県)東京都
(市区町村)品川区
(町名)大崎
(番地)1-11-1
(建物名)ゲートシティ大崎 ウエストタワー22F
姓名の分割 鈴木太郎 (姓)鈴木
(名)太郎

表記の統一

処理内容 例)処理前 例)処理後
英数字とカタカナの全角半角 スズキタロウ
スズキタロウ
スズキタロウ
スズキタロウ
東京都品川区大崎1-11-1ゲートシティ大崎ウエストタワー 22F 東京都品川区大崎1-11-1ゲートシティ大崎ウエストタワー22F
ハイフンの有無 03-4214-1020
0342141020
03-4214-1020
03-4214-1020
法人格の統一
※正式名称、略称どちらへの統一も可
株式会社メトロ
(株)メトロ
㈱メトロ
株式会社メトロ
株式会社メトロ
株式会社メトロ

情報の補完、妥当性の判断

処理内容 例)処理前 例)処理後
住所から郵便番号を付与 東京都品川区大崎1-11-1ゲートシティ大崎 ウエストタワー22F 〒141-0032 東京都品川区大崎1-11-1ゲートシティ大崎 ウエストタワー22F
旧住所を新住所に変換 埼玉県浦和市北浦和1-2-3 埼玉県さいたま市浦和区北浦和1-2-3
住所コードを付与 住所コードなし 11107******
※国土地理協会とのご契約のあるお客様は11桁コードの付与が可能
市外局番の補完 4214-1020 03-4214-1020

データクレンジング・名寄せのお問合わせはこちら

名寄せとは?

名寄せとは、ある個人・世帯のデータが複数存在している場合に、住所や名前などの情報から、同一人物、同一世帯であることを関連付ける処理を指します。

名寄せの具体例

主な名寄せ方法は以下の通りです。名寄せ後の活用内容により、完全一致、部分一致などの方法で実施します。また、名寄せの精度を向上させるためには、あらかじめデータクレンジングが必要となります。

① 複数の情報が曖昧な場合でも1つにまとめたい

複数の項目のうち、予め指定した条件で一致した場合、同一と判定します。例えば、同一のDMを一つの世帯で一通にまとめることで無駄なDM発送を防ぐことができ、コスト削減に繋げられます。

例:
(名寄せ条件)名前の一部、住所が一致している場合に同一世帯とみなす
名前 住所 電話番号 判定結果
鈴木太郎 埼玉県さいたま市浦和区北浦和1-2-3 080-1234-5678 同一世帯
鈴木太郎 埼玉県さいたま市浦和区北浦和1-2-3 048-800-0000 同一世帯
鈴木花子 埼玉県さいたま市浦和区北浦和1-2-3 048-800-0000 同一世帯
鈴木太郎 静岡県沼津市西沢田347 055-923-8327

② 複数の情報が完全一致した場合のみ1つにまとめたい

厳密に個人を特定したい場合、指定したすべての項目で完全一致したものを同一と判定します。
例えば、金融機関等での口座開設や会員登録の本人確認などで個人を特定し、その人に関する情報を1つに集約する場合に有効です。

例:
(名寄せ条件)指定したすべての項目が完全一致している場合に同一人物とみなす
名前 住所 電話番号 判定結果
鈴木太郎 埼玉県さいたま市浦和区北浦和1-2-3 048-800-0000 同一人物
鈴木太郎 埼玉県さいたま市浦和区北浦和1-2-3 048-800-0000 同一人物
鈴木太郎 埼玉県さいたま市浦和区北浦和1-2 048-800-0000
鈴木太郎 埼玉県さいたま市浦和区北浦和1-2 080-1234-5678
鈴木花子 埼玉県さいたま市浦和区北浦和1-2-3 048-800-0000

データクレンジング・名寄せのお問合わせはこちら

データ品質を維持することで得られるメリット

データクレンジングと名寄せを行って、データ品質を維持するメリットは次の通りです。

メリット①:顧客管理コストの削減

住所や名前のデータが不正確だと、配送や連絡などが遅延したり再対応が必要になったり、同一人物に同じ内容の連絡をしてしまう場合があります。さらに、不正確や不要なデータがあると、顧客分析をする際にもコストの無駄が発生してしまいます。

不正確や不要なデータを削除することで、これらの問題を解決してコスト削減に繋げることができます。


メリット②:精度の高い顧客分析

データクレンジングと名寄せによって、顧客の居住地域や名前などの情報を正確に把握でき品質の高いデータを使った分析ができるようになることで、ターゲット層を明確にしたマーケティング戦略の策定が可能になります。


メリット③:顧客からの信頼性の確保

住所や名前の正確な情報を保管することが義務付けられている場合があります。データクレンジングを行い、情報の補完やデータの妥当性を判断することで、正確な情報を保管することができます。

Excel(エクセル)で行うデータクレンジングのメリットとデメリット

データクレンジングを行う方法の一つとして、Excel(エクセル)を利用することが挙げられます。Excelには、基本的なデータクレンジング機能が備わっており、比較的簡単にデータクレンジングを行うことができます。
しかし、Excel単体でデータクレンジングを行う場合には、以下のような問題点を考慮する必要があります。

問題点①:処理の精度が不十分

Excelは、住所や名前のデータを正確に処理するための専門的なアルゴリズムを備えておらず、処理の精度が不十分になることがあります。例えばExcelでは、漢字の表記揺れや、地名の表記変更などを正確に処理することができません。

問題点②:複雑な処理ができない

Excelでも正規表現を使った処理が可能ですが、単純なものに限られます。住所や名前をデータクレンジングする際に必要な、複雑な正規表現の処理ができません。

問題点③:処理に時間がかかる

Excelではデータが大量な場合、処理時間がかかったり、処理中にエラーが発生したりすることがあります。

日本固有の住所や名前のデータクレンジング・名寄せをするためには、
複雑で難しい処理にも対応できる経験とノウハウが必要です。

メトロのデータクレンジングサービスなら

メトロでは、データクレンジング業者として20年以上のサービス提供実績がございます。

提供方法

  • 受託処理サービス

    データをお預かりしてメトロ内で処理を行います。標準処理の他、お客様の仕様に合わせた処理が可能です。

  • アプリケーション

    お客様ご自身でデータを処理したい場合は、メトロ独自開発の日本語のデータクレンジングに特化したツールをご提供します。

  • システム開発

    データクレンジングの自動化をしたいお客様は、API提供に加えシステム開発も承ります。
    既存のシステム(BI、CRM、SFA等)との連携も可能です。

お客様のデータの状況やデータクレンジング後の活用イメージを協議しながら、お客様に合ったカスタマイズを施したデータクレンジング、ノウハウのご提供、コンサルティングを行っております。


メリット①:複雑で難しい処理にも対応

メトロには、日本固有の住所や名前に対するクレンジング処理や、複数のデータソースから取り込まれたデータを正確にクレンジングし、名寄せするために必要な経験とスキルがあります。また、有用な参照情報(辞書データ)を有しているので適切な判断が可能です。

メリット②:効率的に処理できる

高度なテクノロジーを施した専用のツールにより、効率的かつ正確に住所・名前のクレンジングを行うことができます。また、大量のデータを処理する際にも、早く正確に処理できるため、時間と労力を節約することができます。

メリット③:個人情報の保護に配慮している

住所・名前のクレンジングは、個人情報保護に関する法律や規制に則って行わなければなりません。メトロでは、個人情報の漏洩や不正利用を防止するため、適切なセキュリティ対策を講じた環境(データクレンジング専用ルーム)で処理を行います。
※個人情報保護認証(Pマーク、ISO9001、ISO27001)を取得済み

資料請求・お問合わせはこちらから

まずはお気軽にお電話またはフォームからお問合わせください

ページトップへ戻る