Quantcast
Channel: CNode:Node.js专业中文社区
Viewing all articles
Browse latest Browse all 14821

[北京团结湖]闪银奇异招聘nodejs爬虫工程师

$
0
0

公司介绍

闪银奇异是一家互联网征信公司,业务遍及国内外,目前获招商局,SIG,光远资本8000 万美元C轮投资。发展历程与详细介绍

招聘职位

爬虫工程师

原则上不限开发语言(够屌的话),但更期望是一名noder.

爬虫属于大数据的数据抓取部分,闪银爬虫组平时爬取网银交易流水,淘宝京东订单等信息,为机器学习部门进行大数据分析提供基础数据。

写的是爬虫,但不仅仅是爬虫,也许你会被leader派去研究图片验证码自动识别算法,也许会被派去研究结构化html文档内容自动提取算法。 经常会有组内分享。在闪银你会学到更多,拥有更多的可能性!

基本技能要求

  • 了解html,熟练使用css选择器
  • 熟练使用javascript
  • 熟悉http协议
  • 良好的编码习惯
  • 能轻松搞定一个股票爬虫(爬取股票交易数据,目标网站可选东方财富,百度股票)

如果会这些,我们非常欢迎

  • 有过相关爬虫经验,比如爬过京东
  • 对机器学习感兴趣,并有相应的小作品(爬虫也会用到机器学习哦,比如图片验证码识别)
  • 懂反编译,可以破解加壳的APP(andriod OR IOS)
  • 能绕过登录控件(ActiveX控件,排除webdriver类似的技术)

编程题目

1. [算法题] 给定一系列日期数据,写一个函数统一格式。

const test1="1998年9月7日",
       test2="缴费日期:1998年9月7日",
	   test3="1998097",
	   test4="19980907",
	   test5="1998 09 07 12:32:32",
	   test6="1998、09、07",
	   test7="98-  09  -07",
	   test8="1998/ 9/07",
	   test9="日期1998/  9/07",
	   test10="1998-09-07";  

期望实现一个格式化函数format(original_date_str,seperator)(第一个参数是待格式化的日期数据,第二个参数是分格符),format(test1,"-")返回1998-09-07(忽略时分秒),且对 上面的任何一个测试数据都有效。format 函数禁止使用 try catch 或者是case case 的形式,希望是基于对日期数据的一个基本假设为前提,写一个一般化的格式化算法。

2. [综合题] 找出下面俩个站点中任意一个站点的密码加密算法。 注:给出相应的加密函数和使用方法就行,不关心具体的加密逻辑

第一个待选站点:广州社保登录页: http://gzlss.hrssgz.gov.cn/cas/login第二个待选站点:惠州社保登录页: http://113.106.216.244:8003/web/ggfw/app/index.html#/ggfw/grbsxq

简历砸过来吧

满足基本技能要求就可以砸简历过来了,能搞定编程题的更欢迎 ^-^ 简历砸向 :dingziran@wecash.net 。答案可以附在简历里面


Viewing all articles
Browse latest Browse all 14821

Trending Articles