博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
PHP中文URL编解码(urlencode()rawurlencode()
阅读量:5278 次
发布时间:2019-06-14

本文共 3011 字,大约阅读时间需要 10 分钟。

PHP中对于URL进行编码,可以使用 urlencode() 或者 rawurlencode(),二者的区别是前者把空格编码为 '+',而后者把空格编码为 '%20',不过应该注意的是,在编码时应该只对部分URL编码,否则URL中的冒号和反斜杠也会被转义。
详细解释:///\\\
string urlencode ( string str)
返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 RFC1738 编码(参见 rawurlencode())不同。此函数便于将字符串编码并将其用于 URL 的请求部分,同时它还便于将变量传递给下一页: 例子 1. urlencode() 示例
<?php
echo '<a href="mycgi?foo=', 
urlencode(
$userinput), '">';
?>
注意:小心与 HTML 实体相匹配的变量。像 &、© 和 £ 都将被浏览器解析,并使用实际实体替代所期待的变量名。这是明显的混乱,W3C 已经告诫人们好几年了。参考地址:http://www.w3.org/TR/html4/appendix/notes.html#h-B.2.2 PHP 通过 arg_separator .ini 指令,支持将参数分割符变成 W3C 所建议的分号。不幸的是大多数用户代理并不发送分号分隔符格式的表单数据。较为简单的解决办法是使用 & 代替 & 作为分隔符。你不需要为此修改 PHP 的 arg_separator。让它仍为 &,而仅使用 htmlentities(urlencode($data)) 对你的 URL 进行编码。
例子 2. urlencode() 与 htmlentities() 示例
<?php
echo '<a href="mycgi?foo=', 
htmlentities(
urlencode(
$userinput)), '">';
?>
string urlencode ( string str)
返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数。这是在 RFC 1738 中描述的编码,是为了保护原义字符以免其被解释为特殊的 URL 定界符,同时保护 URL 格式以免其被传输媒体(像一些邮件系统)使用字符转换时弄乱。例如,如果你想在 FTP 的 URL 中包含密码:
例子 1. rawurlencode() 示例 1
<?php
echo '<a href="ftp://user:', 
rawurlencode('foo @+%/'),
'@ftp.my.com/x.txt">';
?>
或者,如果你想通过 URL 的 PATH_INFO 构成部分去传递信息:
例子 2. rawurlencode() 示例 2
<?php
echo '<a href="http://x.com/department_list_script/',
rawurlencode('sales and marketing/Miami'), '">';
?>
在解码时,可以使用相应的 urldecode() 和 rawurldecode(),相应地,rawurldecode() 不会把加号('+')解码为空格,而 urldecode() 可以。 下面是详细示例:
string urldecode ( string str)
解码给出的已编码字符串中的任何 %##。返回解码后的字符串。 例子 1. urldecode() example
<?php
$a = 
explode('&', 
$QUERY_STRING);
$i = 0;
while (
$i < 
count(
$a)) {
$b = 
split('=', 
$a[
$i]);
echo 'Value for parameter ', 
htmlspecialchars(
urldecode(
$b[0])),
' is ', 
htmlspecialchars(
urldecode(
$b[1])), "<br />n";
$i++;
}
?>
string rawurldecode ( string str)
返回字符串,此字符串中百分号(%)后跟两位十六进制数的序列都将被替换成原义字符。
例子 1. rawurldecode() 示例
<?php
echo 
rawurldecode('foo%20bar%40baz'); 
//
 foo bar@baz
?>
注意:

urldecode() 和 rawurldecode() 解码出的字符串是 UTF-8格式的编码,如果URL中含有中文的话,而页面设置又不是 UTF-8 的话,则要把解码出的字符串进行转换,才能正常显示!

还有一个问题,就是所获得的 URL 不是 %%nn n={0..F} 的格式,而是 %unnnn n={0..F} 的格式,这时候再使用 urldecode() 和 rawurldecode() 是无法正确解码的,而要可以正确解码的函数:
<?php
function utf8RawUrlDecode (
$source)
{
$decodedStr = "";
$pos = 0;
$len = 
strlen (
$source);
while (
$pos < 
$len) {
$charAt = 
substr (
$source
$pos, 1);
if (
$charAt == '%') {
$pos++;
$charAt = 
substr (
$source
$pos, 1);
if (
$charAt == 'u') {
//
 we got a unicode character
$pos++;
$unicodeHexVal = 
substr (
$source
$pos, 4);
$unicode = 
hexdec (
$unicodeHexVal);
$entity = "". 
$unicode . ';';
$decodedStr .= 
utf8_encode (
$entity);
$pos += 4;
}
else {
//
 we have an escaped ascii character
$hexVal = 
substr (
$source
$pos, 2);
$decodedStr .= 
chr (
hexdec (
$hexVal));
$pos += 2;
}
else {
$decodedStr .= 
$charAt;
$pos++;
}
}
return 
$decodedStr;
posted on
2013-08-18 12:30 阅读(
...) 评论(
...)

转载于:https://www.cnblogs.com/linuxnotes/p/3265826.html

你可能感兴趣的文章
排序sort (一)
查看>>
Parrot虚拟机
查看>>
Teamcenter10 step-by-step installation in Linux env-Oracle Server Patch
查看>>
Struts2学习(三)
查看>>
Callable和Runnable和FutureTask
查看>>
GitHub 多人协作开发 三种方式:
查看>>
文本域添加编辑器
查看>>
Yum安装MySQL以及相关目录路径和修改目录
查看>>
java获取hostIp和hostName
查看>>
关于web服务器和数据库的各种说法(搜集到的)
查看>>
《TCP/IP 详解 卷一》读书笔记 -----第四章 ARP
查看>>
C# Stream 和 byte[] 之间的转换
查看>>
OMG: daily scrum nine
查看>>
redis与spring结合错误情况
查看>>
第六章 字节码执行方式--解释执行和JIT
查看>>
字符串方法title()、istitle()
查看>>
yield语句
查看>>
查看linux系统中占用cpu最高的语句
查看>>
[洛谷P1738]洛谷的文件夹
查看>>
ubuntu server设置时区和更新时间
查看>>