`
kankan1218
  • 浏览: 271829 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

日文网站搜索时,关键字在url地址栏里有一个编码的过程,perl怎么获得这个编码后的结果?

    博客分类:
  • perl
阅读更多
日文网站搜索时,关键字在url地址栏里有一个编码的过程,perl怎么获得这个编码后的结果?
比如说在 http://voi.0101.co.jp/voi/index.jsp 这个网站搜索关键字 サマー ,
得到的url是:http://search-voi.0101.co.jp/voi/freeword/?store=&q=%83T%83%7D%81%5B ,
我现在想知道怎么用perl实现把 サマー 转化为 %83T%83%7D%81%5B ?

---------------------------------------------------------------------------------------------


Shift_JIS是cp932的子集,就好比中文字符编码gb2312是cp936(gbk)的子集一样。

%83T%83%7D%81%5B
uri_escape的结果,把不合法的URI字符(包含控制字符、大部分标点、大于0x7F的字符)用%XX表示,合法的字符(包含大小写字母、数字、部分标点)可以直接显示。

之前是用Python试的。现在用Perl试了下,结果正常:

Perl code:
#!/usr/bin/perl
use URI::Escape qw(uri_escape);
use Encode qw(encode decode);

$string = 'サマー ';
$uri_cp932 = uri_escape(encode('cp932', decode('utf8', $string)));
$uri_shiftjis = uri_escape(encode('shiftjis', decode('utf8', $string)));
print "$string\t$uri_cp932\t$uri_shiftjis\n";

# 运行结果:
# サマー  %83T%83%7D%81%5B%20     %83T%83%7D%81%5B%20

分享到:
评论

相关推荐

    编码转换程序(日文编码等)

    自动识别转换前文件的编码,只需要选择要转换的编码,然后点击转换就可以了,支持文件到文件和文件夹到文件夹的转换。

    日文版的c#编码規約

    一个日文版的c#编码規約,pdf格式的

    日文编码规范

    日文编码规范,一些SQL啊,PG等参考

    日文 编码 规范

    日文 编码 规范 很好用的

    c#编码規約日文版c#编码規約日文版

    c#编码規約日文版c#编码規約日文版c#编码規約日文版c#编码規約日文版

    日文版的VB编码规约

    日文版的VB编码规约,对于做对日外包项目的人员应该有所帮助的。大家可以看看,有利于养成一个好的编码习惯。

    日文版SQL的编码规约

    日文版SQL的编码规约,对于做对日外包项目的人员应该有所帮助的。大家可以看看,有利于养成一个好的编码习惯。

    日语编码换换器

    可以装日语shift-jis编码转为bgk编码,对于乱码txt文件实现正常显示。内有源码

    Java编码规范(日文版)

    Java编码规范(日文版)

    日文网站建设系统

    日文网站建设系统采用主流的Asp+Access开发设计,开发新日文模板,更大气,更漂亮!是方便自主管理的日本网站建设系统,程序小巧,速度快,后台一站式管理,代码功能全部开源,无任何限制。支持所有Asp虚拟空间,...

    asp 日文企业网站管理系统

    日文企业网站管理系统根据英文管理系统翻译改编,采用主流的Asp+Access开发设计,是方便自主管理的日文网站建设系统,程序小巧,速度快,后台一站式管理,代码功能全部开源,无任何限制。支持所有Asp虚拟空间,兼容...

    日文网站建设系统.rar

    日文网站建设系统采用主流的Asp Access开发设计,开发新日文模板,更大气,更漂亮!是方便自主管理的日本网站建设系统,程序小巧,速度快,后台一站式管理,代码功能全部开源,无任何限制。支持所有Asp虚拟空间,...

    初心者用perl講座(日语版)

    初心者用perl講座(日语版) 介绍Perl编程知识,学习计算机日语的好资料。

    GB2312编码对照表

    GB2312简体中文编码表 GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682...区和位分别占用一个字节。

    日文版的ASP编码规约

    日文版的ASP编码规约,对于做对日外包项目的人员应该有所帮助的。大家可以看看,有利于养成一个好的编码习惯。

    日文企业网站管理系统.rar

    日文企业网站管理系统根据英文管理系统翻译改编,采用主流的Asp Access开发设计,是方便自主管理的日文网站建设系统,程序小巧,速度快,后台一站式管理,代码功能全部开源,无任何限制。支持所有Asp虚拟空间,兼容...

    日文字库Sjis码表

    日文字库Sjis码表 sjis--gbk

    编码模拟器v1.0绿色版支持ANSI编码

    功能介绍 在文本字元编码之间进行转换(包括UTF-8,没有bom标记的UTF-8,UTF-16le,UTF-16be,UTF-32le,UTF-32be,中文简体GBK,中文繁体BIG5,日文 shift-JIS, 日文 euc-jp, 韩文 euc-kr等, 请参照支援的

    日文汉字码表【文本格式】

    很全面的日文码表。 例: 【儛】[JIS第4水準] SJIS: ── Unicode: 511B [用例] 岩手県一関市舞川 字 大平 儛草神社(まいくさじんじゃ・神社名称)

    Shift JIS编码表

    Shift JIS编码表,很容易找到,方便懒人

Global site tag (gtag.js) - Google Analytics