最近需要抓取一些web站点进行分析,代码如下: var req=https.get(opts, function (res) { console.log("Got response: " + res.statusCode); res.on(‘data’,function(d){ body += d; }).on(‘end’, function(){
var page= crawlerPage(body); //此处body为所谓的“乱码”,即html实体 });
想请教一下,如何将获得的html实体转为我们能看得懂的正常字符串?