パスワードを忘れた? アカウント作成
13433927 story
インターネット

世界のWebサイトで文字コードがUTF-8のページが90%を超える 28

ストーリー by hylom
ちゃんと指定してくれれば問題は無いのだが 部門より

W3Techsが公開している「Usage of character encodings for websites」という統計情報によると、世界中のWebサイトにおいて使われている言語のうち、UTF-8の割合が90%に達している(INTERNET Watch)。

とはいえ、Shift-JISやEUC-JPも多少ではあるがまだ使われており、Shift-JISについてはKakaku.comや2ch.netなど、EUC-JPについてはRakuten.co.jpやGeocities.jp、Mixi.jpなどで使われているという。

関連リンク

  • by nemui4 (20313) on 2017年10月18日 13時27分 (#3297538) 日記

    未だに社内向けの適当なWeb頁では charset=x-euc-jp つこてまんがな。
    #Terminal環境設定のまま

    ここに返信
  • by Anonymous Coward on 2017年10月18日 13時56分 (#3297553)

    ISO-8859-1がたったの4.6%というのに驚いた

    何の根拠もなく漫然と、50%くらいあるんじゃないかと思ってた

    ここに返信
  • by Anonymous Coward on 2017年10月18日 13時56分 (#3297554)

    UTF-8以外は規格違反だそうですね。
    なんでそんなことになったんだか…。

    ここに返信
  • by Anonymous Coward on 2017年10月18日 14時05分 (#3297565)

    utf-8 が大多数なのは想定内としても、
    それ以外の数字がかなり意外。感想を並べると、

    ・iso-8859-1が思ったより随分少ない。

    ・世界統計であって日本国内限定でないのに、パーセンテージの4番目に ShiftJISがある。

    ・中国語圏のBig5が極端に少ない。

    ・アラビア系が少ないのは逆に想定内か。

    ・EUC-KRはまぁこんなもんか。

    ・ロシア系キリル文字圏や、イタリア、スペイン、フランス等のアクセント記号付きアルファベット文化圏は全部Unicodeに含まれるとして、固有のエンコードって無かったのかしら。

    ぱっと頭をよぎったのはこんな感想。

    ここに返信
    • by Anonymous Coward

      Windows-なんちゃらがそうだよ。

      >固有のエンコードって無かったのかしら。

  • by Anonymous Coward on 2017年10月18日 14時23分 (#3297580)

    ISO-2022-JPじゃなくてUTF-8になってくれ。

    ここに返信
  • by Anonymous Coward on 2017年10月18日 14時35分 (#3297588)

    取り扱う文書が全部 UTF-8 になって苦労がないのになぁ。

    ここに返信
    • by Anonymous Coward
      VisualStudioの標準でさえUTF-8になったんだし、わざわざメモ帳とかで明示的に指定して作らない限りUTF-8じゃないファイルなんてWindows上にもなくない?
      もう何年もエロげのREADME以外でSJISのテキストは見たことないよ
      • by Anonymous Coward

        ファイル名もUTF-8にしてほしいでありんす。
        LinuxもMacもUTF-8なのにシェア多数のWindowsだけがSJISなせいで圧縮ファイルのやりとり面倒。
        MacでUTF-8で書いたテキストファイルもWindowsの知り合いのマシンじゃ文字化けと文句言われる。
        ほんとWindowsさんもうそろそろ勘弁してほしい。

        Appleも思いきって(APFSに)ファイルシステム変えるまで強引にしてきたし、Windowsさんも文字コード変えちゃいましょうよ。

        • NTFSはUTF-16ですよ。FATもLFN使ってるならUTF-16です。
          圧縮ファイルっていうところからzipの問題だと思いますが、フォーマット自体の問題もありますが、世の中に出回っている圧縮展開ソフトの実装がクソすぎるのでどうにもならないでしょう。zipは捨てて7zにしよう。
        • by Anonymous Coward

          UTF8同士でも化けるのよね
          http://macwiki.osdn.jp/wiki/index.php/UTF-8-MAC [macwiki.osdn.jp]

        • by Anonymous Coward

          世界中から殺到するであろうゴカンセイガーという苦情に対して
          お前がMSに代わって半永久的に無料で24時間サポートするんならやってくれるよ、多分

        • by Anonymous Coward

          使ってる圧縮ツールの問題ですよね。
          Windows上のアーカイバって、メジャーなものはエンコードは選択できるのが普通。
          WinRar/WinZip あたりは、デフォルトエンコードも UTF-8 、7zip は、オプション指定が必要ですけどね。

          まぁ UTF-8 に統一されても MacはUTF-8を名乗ってても UTF-8-MACのことでUTF-8ではないので、問題は解決しませんが。

          • by Anonymous Coward

            Windows自体(エクスプローラ)にも圧縮機能があってですね…。
            しっかりSHIFT_JISになってるようです。(Windows7では)
            じゃあそれに含まれない文字のファイル名なファイルを圧縮…できない模様。

      • by Anonymous Coward

        WSHとかシェル(コマンドプロンプト)のリダイレクトとか。

      • by Anonymous Coward

        メモ帳でBOMありUTF-8しか作れないの何とかして欲しい。

  • by Anonymous Coward on 2017年10月18日 14時50分 (#3297596)

    リンク先にあった

    See technologies overview for explanations on the methodologies used in the surveys.

    を辿って出たページに、こう書いてあった。
    https://w3techs.com/technologies [w3techs.com] 

    We include only the top 10 million websites (top 1 million before June 2013) in the statistics in order to limit the impact of domain spammers. We use website popularity rankings provided by Alexa (an Amazon.com company) using a 3 months average ranking. Alexa rankings are sometimes considered inaccurate for measuring website traffic, but we find that they serve our purpose of providing a representative sample of established sites very well.

    ここ5年以内で、Alexaのランキング100万を占めた1000万のサイトの文字コードから判定しているらしい、程度にしかおいらにはわからんので、引用していない部分も含め、精確な解説希望。

    ここに返信
  • by Anonymous Coward on 2017年10月18日 15時44分 (#3297646)

    同じソースのserver locations for websites [w3techs.com]によると日本にあるサーバーは5.5%。

    単純に国内以外に日本語のページがないと考えちゃうと、
    Shift JIS 0.8%、EUC-JP 0.3%は合計20%に相当。UTF8は80%相当ということかな。世界が90%だからちょっと遅れてる感じ。

    #統計にある「language」は意味が違った・・・

    ここに返信
typodupeerror

アレゲはアレゲを呼ぶ -- ある傍観者

読み込み中...