公司介绍
闪银奇异是一家互联网征信公司,业务遍及国内外,目前获招商局,SIG,光远资本8000 万美元C轮投资。发展历程与详细介绍
招聘职位
爬虫工程师
原则上不限开发语言(够屌的话),但更期望是一名noder.
爬虫属于大数据的数据抓取部分,闪银爬虫组平时爬取网银交易流水,淘宝京东订单等信息,为机器学习部门进行大数据分析提供基础数据。
写的是爬虫,但不仅仅是爬虫,也许你会被leader派去研究图片验证码自动识别算法,也许会被派去研究结构化html文档内容自动提取算法。 经常会有组内分享。在闪银你会学到更多,拥有更多的可能性!
基本技能要求
- 了解html,熟练使用css选择器
- 熟练使用javascript
- 熟悉http协议
- 良好的编码习惯
- 能轻松搞定一个股票爬虫(爬取股票交易数据,目标网站可选东方财富,百度股票)
如果会这些,我们非常欢迎
- 有过相关爬虫经验,比如爬过京东
- 对机器学习感兴趣,并有相应的小作品(爬虫也会用到机器学习哦,比如图片验证码识别)
- 懂反编译,可以破解加壳的APP(andriod OR IOS)
- 能绕过登录控件(ActiveX控件,排除webdriver类似的技术)
编程题目
1. [算法题] 给定一系列日期数据,写一个函数统一格式。
const test1="1998年9月7日",
test2="缴费日期:1998年9月7日",
test3="1998097",
test4="19980907",
test5="1998 09 07 12:32:32",
test6="1998、09、07",
test7="98- 09 -07",
test8="1998/ 9/07",
test9="日期1998/ 9/07",
test10="1998-09-07";
期望实现一个格式化函数format(original_date_str,seperator)
(第一个参数是待格式化的日期数据,第二个参数是分格符),format(test1,"-")
返回1998-09-07
(忽略时分秒),且对
上面的任何一个测试数据都有效。format 函数禁止使用 try catch 或者是case case 的形式,希望是基于对日期数据的一个基本假设为前提,写一个一般化的格式化算法。
2. [综合题] 找出下面俩个站点中任意一个站点的密码加密算法。 注:给出相应的加密函数和使用方法就行,不关心具体的加密逻辑
第一个待选站点:广州社保登录页: http://gzlss.hrssgz.gov.cn/cas/login第二个待选站点:惠州社保登录页: http://113.106.216.244:8003/web/ggfw/app/index.html#/ggfw/grbsxq
简历砸过来吧
满足基本技能要求就可以砸简历过来了,能搞定编程题的更欢迎 ^-^ 简历砸向 :dingziran@wecash.net 。答案可以附在简历里面