027-87887360

新闻资讯

金融软件开发为什么普通开发商无法做

金融软件开发为什么普通开发商无法做,因为有技术门槛,沪深300历史交易数据的网页如下:


我们可以看到,金融软件开发年份和季度都需要从下拉列表中选择。但不同股票可选择的年份不同,原因很简单,不同股票上市的时间不同,所以起始年份必然不同。这样,我们就需要写一个方法,先把年份下拉列表中的数据得到,从而得到爬取数据的时间范围。


注明:我这里用的 HTML 解析器是 Jumony Core。可以到 https://github.com/Ivony/Jumony 下载。


金融软件开发这个解析器非常简单,给一个网址进去,就能够得到该网址请求的 DOM Tree,利用 JQuery 选择器语法,很方便地定位到要爬取的数据内容。


以上,金融软件开发数据的爬取就搞定了,下面介绍数据的存储。


金融软件开发为了避免数据的重复存储,除了建立 沪深300_000300 这张数据表来存储爬取的数据外,还需要建立一张数据表 Stock_InputLog 用来存储数据导入的日志。


Stock_InputLog 包含字段:


- 股票代码


- 年份


- 季度


- 开始日期


- 结束日期


- 备注


沪深300_000300 包含字段:


- 日期


- 年份


- 季度


- 开盘价


- 最高价


- 收盘价


- 最低价


- 平均价1 [=(开盘价+最高价+收盘价+最低价)/4]


- 交易量


- 交易金额


- 平均价2 [=交易金额/交易量]


- 分位数25


- 分位数40


- 分位数50


- 分位数60


- 分位数75


- 当前分位数