Please Sign In or Register

日本語ドメイン

日本語ドメインについて、ちょっと興味があったので調べてみた。
価格やフィッシングサイト云々ということではなく、日本語ドメインを英数字の綴りに変換したときの形式が気になったからだ。
もちろん、Drupal 内部で日本語の URL として正しく動作するのか、英数字に変換しなければならないのかなども気になっていたのだが、それは、取得することがあったらそのときに改めて試してみたいと思う。

まず始めに、多言語ドメインを変換した英数字は Punycode と呼ばれ、IETF によって、RFC 3492 として標準化されているそうだ。
多言語ドメイン を Punycode に変換すると、まず、先頭に多言語ドメイン名であることを示す 「xn--」 が付き、それに続けて 「符号化された ASCII 文字列」 + 「.jp などのドメイン」 が続く形式になる。

例えば、多言語ドメイン を Punycode で表示すると、「多言語.jp」 というドメインの場合なら 「xn--cssw15itna.jp」 のようになるらしい。
多言語ドメインに対応していないブラウザ (個人的には Internet Explorer 6 以下のことを指しているのだが...) では、この Punycode を入力するか、プラグインをインストールしなければ多言語ドメインのサイトは閲覧できない。

と、簡単に調べた内容だけで判断するのも問題なのかもしれないが、先頭に追加される 「xn--」 の部分が気になった。
コメントに関する W3C の仕様として、コメント内で連続するハイフンは使えないとなっているので、RDF のメタデータをコメント内に埋め込むという方法を利用している場合など、サイトの情報として 「xn--」 で始まる URL を使うことには問題があるのではないかというものだ。

RDF をコメントアウトすることについての議論はさておき、以下のようにサイトの情報が埋め込まれている場合に、コメントの終了タグである、--> がそのまま出力されているサイトを見かけることがあり、多言語ドメインを使いこなすのは、現状ではなかなか難しそうだと感じた。

<!--
  ・・・・・
  <rdf:Description rdf:about="http://xn--cssw15itna.jp">
  ・・・・・
-->

もちろん、融通の利き過ぎている Internet Explorer では --> が表示されるようなことはないのだが、正しい解析を行うブラウザでは当たり前に表示されてしまう。

多言語ドメインだけでなく、多言語ドメインを使った多言語メールの取り扱いについても興味があるので、時間があればもう少し広範囲に調べてみたい。

[ 参考 ]
RFC 3492 Punycode: A Bootstring encoding of Unicode for Internationalized Domain Names in Applications (IDNA)
Punycode - Wikipedia
日本語JPドメイン名の登録、運用、seoなどの最新情報 / 日本語.jp
対応環境について - 日本語.jp
日本語JPドメイン名のPunycode変換・逆変換 - 日本語.jp
正しいコメントを書こう

トラックバック

トラックバックは承認後に表示されます。

URLから "-nospam" を削除してトラックバックを送信してください。

返信

例えば「あ」と「お」の間の文字を入力してださい。なら、"いうえ"とひらがなで入力します。
このフィールドの内容は非公開にされ、公表されることはありません。
  • ウェブページアドレスとメールアドレスは、自動的にハイパーリンクに変換されます。
  • Allowed HTML tags: <a>
  • 行と段落は自動的に折り返されます。

書式オプションに関するさらに詳しい情報...