2008-07-17(木)
■[UNIX]sortコマンドとuniqコマンドをパイプするよりもsortの-uオプション 
これは↓のようにsortとuniqをパイプで繋げるだけでできます。
ウノウラボ by Zynga Japan: シェルスクリプトでプログラミング
各行がいくつ重複しているか調べるにはuniqの-cオプションを使います。
ウノウラボ by Zynga Japan: シェルスクリプトでプログラミング
実は、sortコマンドにはuというオプションがあり、即時の過酷なテキスト処理が求められる僕のプロジェクトでは、
- レコードが何種類か見たい場合は sort -u
- レコード別の分布数を見たい場合は sort | uniq -c
といった使い分けになっています。sort |uniqよりもタイプ数が少ないからsort -uを使う人が多いようです。ちなみにuniqコマンドは同じ値であっても隣接していないといけないのでsortコマンドとセットで使うことが多いです(参考『UNIX先生』)。
そういえば、速度差を計ったことはありませんね。sort -uの方が有利な気はしますが。
コメントを書く
トラックバック - http://d.hatena.ne.jp/suginoy/20080717/p2
リンク元
- 56 http://www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8&rlz=1T4ADBF_jaJP247JP248&q=sql+更新日
- 44 http://www.google.co.jp/search?hl=ja&client=firefox-a&rls=org.mozilla:ja:official&q=vba+uniq&btnG=検索&lr=lang_ja
- 33 http://www.google.co.jp/search?hl=ja&q=sort+uniq+コマンド&lr=
- 28 http://www.google.co.jp/search?q=sort+uniq+コマンド&lr=lang_ja&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:ja:official&client=firefox-a
- 25 http://www.google.co.jp/search?hl=ja&source=hp&q=sort+uniq+コマンド&lr=&aq=1&oq=sort+uniq
- 25 http://www.google.co.jp/url?sa=t&source=web&cd=1&ved=0CBkQFjAA&url=http://d.hatena.ne.jp/suginoy/20080717/p2&rct=j&q=sort uniq コマンド&ei=3kaxTYy5N5CmvQOMk8GeBw&usg=AFQjCNG_mU1miXbktA-W_QwnYSHySG3m2w
- 19 http://www.google.co.jp/search?hl=ja&lr=lang_ja&client=firefox-a&rls=org.mozilla:ja:official&q=cut+unix+コマンド&start=10&sa=N
- 19 http://www.google.co.jp/search?hl=ja&q=uniq+コマンド&lr=&aq=8&oq=uniq
- 18 http://www.google.co.jp/search?hl=ja&q=unix+sort+コマンド+u&lr=lang_ja
- 17 http://www.google.co.jp/search?hl=ja&q=シェルスクリプト+sort+uniq&btnG=検索&lr=