中金宸大跨平台金融软件定制开发
金融软件开发为什么普通开发商无法做,因为有技术门槛,沪深300历史交易数据的网页如下:
我们可以看到,金融软件开发年份和季度都需要从下拉列表中选择。但不同股票可选择的年份不同,原因很简单,不同股票上市的时间不同,所以起始年份必然不同。这样,我们就需要写一个方法,先把年份下拉列表中的数据得到,从而得到爬取数据的时间范围。
注明:我这里用的 HTML 解析器是 Jumony Core。可以到 https://github.com/Ivony/Jumony 下载。
金融软件开发这个解析器非常简单,给一个网址进去,就能够得到该网址请求的 DOM Tree,利用 JQuery 选择器语法,很方便地定位到要爬取的数据内容。
以上,金融软件开发数据的爬取就搞定了,下面介绍数据的存储。
金融软件开发为了避免数据的重复存储,除了建立 沪深300_000300 这张数据表来存储爬取的数据外,还需要建立一张数据表 Stock_InputLog 用来存储数据导入的日志。
Stock_InputLog 包含字段:
- 股票代码
- 年份
- 季度
- 开始日期
- 结束日期
- 备注
沪深300_000300 包含字段:
- 日期
- 年份
- 季度
- 开盘价
- 最高价
- 收盘价
- 最低价
- 平均价1 [=(开盘价+最高价+收盘价+最低价)/4]
- 交易量
- 交易金额
- 平均价2 [=交易金额/交易量]
- 分位数25
- 分位数40
- 分位数50
- 分位数60
- 分位数75
- 当前分位数
免费试用
分期付款
验收保障
售后质保
见效付款
唯一定制