ここから本文です

SJISからutf8へ utf8からsjisへ

mhp********さん

2012/5/323:01:44

SJISからutf8へ utf8からsjisへ

SJISからUTF-8に変換すると文字化けする文字と
UTF-8からSJISに変換すると文字化けする文字を

それぞれ5つぐらい教えてください。
お願いします

閲覧数:
82,295
回答数:
2
お礼:
100枚

違反報告

ベストアンサーに選ばれた回答

lau********さん

編集あり2012/5/406:00:58

SJISというのがShift_JISコードを表しているのなら

Shift_JISコードは、JIS X0201(半角英数カナ)とJIS X0208(JIS 第1水準/第2水準漢字および記号)という2つのJIS規格にある文字を収録しています。

Shift_JIS-2004という規格もあって、こちらはJIS X0213(JIS 第1水準-第4水準漢字および記号)に対応していますが、これは全く普及していません。

また、通常、Shift_JISコードと言う場合、上記Shift_JISコードの規格にある文字+Microsoft Windowsのシステム外字(NEC特殊文字、NEC選定IBM拡張文字、IBM拡張文字)を含むコードページ932(CP932)の事を指す場合が多いです。

本来のShift_JISコード、Shift_JIS-2004、CP932にしても、それに収録されている文字は全てUnicodeにもあります。

UTF-8はUnicodeのエンコード方式の一つなので、Shift_JISコード→UTF-8に変換して文字化けする文字はありません。
(プログラムのつくりがまちがっていなければ)

UTF-8→Shift_JISコードで対応しない文字は、それこそたくさん有ります。
----------------------
例:以下、お使いの環境によっては正常に表示しないかもしれません。

アラビア文字
UTF-8 Browser Test for Unicode Block 'Arabic'
http://www.fileformat.info/info/unicode/block/arabic/utf8test.htm

タイ文字
UTF-8 Browser Test for Unicode Block 'Thai'
http://www.fileformat.info/info/unicode/block/thai/utf8test.htm

ハングル
UTF-8 Browser Test for Unicode Block 'Hangul Syllables'
http://www.fileformat.info/info/unicode/block/hangul_syllables/utf8...

中国の簡体字
「婦」の簡体字
Unicode Han Character 'married women; woman; wife' (U+5987)
http://www.fileformat.info/info/unicode/char/5987/index.htm
「長」の簡体字
Unicode Han Character 'long; length; excel in; leader' (U+957F)
http://www.fileformat.info/info/unicode/char/957f/index.htm

日本の字でもJIS規格に収録されていない文字
「土吉」「吉野家の吉」
Unicode Han Character 'U+20BB7' (U+20BB7)
http://www.fileformat.info/info/unicode/char/20bb7/index.htm
「土吉」はJIS規格では上の棒が長い「士吉」と同じ文字とされています(包摂)。
変換プログラムの作りによっては「士吉」に変換する物があるかもしれません。

なお、この「土吉」はUTF-16(Unicodeのエンコード方式の一つ)では4バイト必要となるサロゲートペアの文字です。
Unicode対応とうたっていてもサロゲートペアに対応していないプログラムでは文字化けします。

CP932は1-20の○数字を含みますが、本来のShift_JISコードは○数字を含んでいないので、本来のShift_JISコードの場合は○数字は使用出来ません。
①-⑳

また、CP932でも○21以上は収録していません。
㉑-㊿、⓪

音符記号も「♪」しか収録されていません。
以下の文字は未収録です。
「♫」「♬」「♩」

質問した人からのコメント

2012/5/4 07:55:28

笑う ありがとうございます!

ベストアンサー以外の回答

1〜1件/1件中

プロフィール画像

カテゴリマスター

nob********さん

2012/5/323:54:43

文字化けするとすれば変換ソフトの品質の問題ですので、これが文字化けするという事は無いと考えます。
尚、UTF-8は世界中の文字ですがSJISは日本語のみですので変換不能な文字は沢山あります。

あわせて知りたい

この質問につけられたタグ

みんなで作る知恵袋 悩みや疑問、なんでも気軽にきいちゃおう!

Q&Aをキーワードで検索:

Yahoo! JAPANは、回答に記載された内容の信ぴょう性、正確性を保証しておりません。
お客様自身の責任と判断で、ご利用ください。
本文はここまでです このページの先頭へ

「追加する」ボタンを押してください。

閉じる

※知恵コレクションに追加された質問は選択されたID/ニックネームのMy知恵袋で確認できます。

不適切な投稿でないことを報告しました。

閉じる