linux下php中文UTF-8轉換Unicode方法和注意事項

彬彬筆記 • 2020年3月19日 19:09 • PHP • 閱讀 669

先說下遇到問題：1.php沒有內置unicode_ecode函數可以直接使用

2.網上很多資料都是用$str = iconv($encoding, 'UCS-2', $str);

window下轉換出來的是正常的，但在Linux下轉換出來的兩個字符是相反的，用在線unicode轉換工具出來的結果是亂碼。

UCS-2的編碼規則：
windows下默認是UCS-2LE。
linux下默認是UCS-2BE。用iconv(指定UCS-2)來轉換生成的是UCS-2BE的unicode，但可能php環境配置會導致不是UCS-2BE。
windows和linux等多個平台對 UCS-2 的理解不同（UCS-2LE,UCS-2BE），所以為了統一需要直接指定為UCS-2BE。

即把：$str = iconv($encoding, 'UCS-2', $str); 改為$str = iconv($encoding, 'UCS-2BE', $str);

親測轉換出來的unicode可以正常轉換的

下面是本人親測可以使用的函數

function unicode_decode($name)

{

// 轉換編碼，將Unicode編碼轉換成可以瀏覽的utf-8編碼

//$pattern = ‘/([\w]+)|(\\\u([\w]{4}))/i’;

$pattern = ‘/(\\\u([\w]{4}))|([\w]+)|(“)|(:)|(,)|(\\\n)|(-)|({)|(})|( )/i’; //這個位置比上面的多了幾個，是因為不這樣，那些字符就被替換掉了

preg_match_all($pattern, $name, $matches);

if (!empty($matches))

{

$name = ”;

for ($j = 0; $j < count($matches[0]); $j++)

{

$str = $matches[0][$j];

if (strpos($str, ‘\\u’) === 0)

{

$code = base_convert(substr($str, 2, 2), 16, 10);

$code2 = base_convert(substr($str, 4), 16, 10);

$c = chr($code).chr($code2);

$c = iconv(‘UCS-2BE’, ‘UTF-8’, $c);

$name .= $c;

}

else

{

$name .= $str;

}

return $name;

}

下方是調用的

$datareule = unicode_decode($data);

//下方替換，是因為轉換的時候，被過濾掉了，需要替換回來

$datareule = str_replace(“br”, “<br \/>”, “$datareule”);

$datareule = str_replace(“nbsp”, “ ”, “$datareule”);

$datareule = str_replace(“middotmiddotmiddot”, “…”, “$datareule”);

$datareule = str_replace(“\\n”, “”, “$datareule”);

發布者：彬彬筆記，轉載請註明出處：https://www.binbinbiji.com/zh-hant/php/2141.html

學到了 2024年10月11日

學到了，感謝分享。

評論於 Windows11放行軟件通過防火牆 Windows11放行IDM
暮光下的少年 2023年1月30日

求方法大佬

評論於小說網站等徹底解決瀏覽器轉碼的方法（親測有效）
明天 2022年7月26日

大佬，已經轉碼的該怎麼辦呀？？求方法

評論於小說網站等徹底解決瀏覽器轉碼的方法（親測有效）
彬彬筆記 2022年6月29日

這個就是直接用在寶塔面板上面的，不需要修改路徑，直接全部複製進去就行了。直接在寶塔面板的定時任務裡面設置就行了。

評論於 memcache停止後自動重啟的解決辦法
gdh 2022年6月23日

安裝非常順利

評論於 windows怎麼安裝composer（超詳細圖文教程）

linux下php中文UTF-8轉換Unicode方法和注意事項

相關推薦

php函數stripos使用方法

解除php函數preg_match_all字符長度限制，解除php函數preg_match字符長度限制

php函數preg_replace高級使用方法

PHP 中解碼 Unicode 編碼的字符串，將正常的字符串編碼為 Unicode 編碼

php獲取文件的內容並賦值給變量

php函數preg_replace使用方法

發表回復