杉原航太@kota_sugihara·6月4日河野太郎がマイナンバーカードの住所照合についてデジタル音痴ぶりを如何なく発揮した件 河野大臣『問題は住所が「港区赤坂一丁目2の3」と書く人もいれば、「港区赤坂1-2-3」と書く人もいる…(中略)将来的にはAIの技術を使って表記揺れを判断することがあり得るかもしれない。』… さらに表示メディアを再生できません。再読み込み4314,0355,828588.8万
清水ひろあき@北九州市@shimihiro_kitaq思いつきで適当に言うけど、例えば「丁目」「番」を置換で「-」にして、あとMIDで漢数字を抽出して一から順に並べてセルわけてFINDでアラビア数字にするとか。逆も然り。一回組んでしまえばずっと使えると思うんだけど、そんなに大変な何かがあるのかな、、、午後4:58 · 2023年6月5日·19.6万 件の表示74 件のリツイート118 件の引用26 件のいいね15 ブックマーク
kzk_maeda | 6/24 Reject Day 2023!!@kzk_maeda·16時間最初の処理だけでこれだけの地名にバグを生みます https://chimei.jitenon.jp/data/kanji.php?kanji=%E7%95%AA… https://chimei.jitenon.jp/data/search.php?getdata=%E4%B8%81%E7%9B%AE&search=contain…chimei.jitenon.jp漢字「番」を含む地名漢字「番」を含む地名(市区町村・町域名)を一覧で表示しています。119983.6万
てんまにちゃん٩(๑ᵕᴗᵕ๑)و@TenmaniChan·8時間名寄せの奥深さとヤバさは、実際にその業務に従事した者にしかわからないですね。 そんな小手先の置換で解決するレベルじゃないです。16364,669
スケアクロウ@Scarecrow209·8時間丁目や番だけで済めばいいですけど、ものによっては地名にも複数の書き方があったりしますよ。 「市ケ谷」と「市ヶ谷」とか「真美ヶ丘」と「真美が丘」とか4137,318
moe@moecomipo·7時間名寄せはシステムでは一番難関です。 しかも住所は古いデータや自治体統廃合あるから全国民分は難関。 名刺システムなど名寄せのノウハウ、知見のある会社でないと難しい。usonar.co.jpエクセルでの名寄せ処理と外部委託の名寄せ・データクレンジングの比較 2016年06月20日 | マーケティングブログ | ユーソナー2016年06月20日 「名寄せ」と検索すると、関連キーワードに「エクセル 名寄せ 」や「excel 名寄せ」が表示されます。このことからも、excelで名寄せを実施しようと考えている方が多いと考えられます。そこで今回は、CRM、最適なマーケティングの第一歩とも言える、顧客データの名寄せについて、方法とその注意点を説明したいと思います。10236,472
ナスカ (Chiether, Nazka)年内喪中@Chiether·6時間2丁目8番を2-8にするとして。 二丁目4番or二丁目4番地(本来は2丁目8番)を2-4と置換し、2-8とは別として扱う。ただし二丁目8番地しか存在しない場合であれば、慣例的に2丁目8番であろうとみなして、2-8であり同一のものとして扱う。しかし置換処理だけで頑張っているので妥当性は判断しない。 と?123,502
napsucks@napsucks·5時間ちなみにミスったらニュースになるオマケがつきます。 報道「またしても住所システムでxxxx件の入力ミス!xx億円が無駄に!」 大臣「AIでどうにかなると聞いていた。騙された思いで大変遺憾だ。業者には再発防止の徹底を申し入れたい」2122,269
九州人(チェス駒の数程の歳)@kyusyujin·5時間素人質問で、大変、恐縮ですが、例えば、四日市、八戸、北九州、千葉etc...のように漢数字が入っていたり、八丁堀、麻布十番、名号etc..のように、地名の途中に番地を表す文字がある場合はどのようにするのですか?そのあたりまで、考慮されているのであれば、noteを書かれましたら、読もうと思います482,277
つれづれ@g6tBbqdGZ24UWq1·5時間データクレンジングって大変なんですよ。 例えば「石川県石川郡野々市町本町」 これを都道府県/市区町村で分けようとしても、正規表現では無理。 結局、住所データベースを用意しての突合作業後、それでも漏れたデータは個別に照合して…みたいな。 「郡/字/大字」辺りも悩みの種だったなぁ…。493,310