5组-Beta冲刺-1/5


一、基本情况

  • 队名:奶茶命运共同体
  • 组长博客:
  • Github链接:https://github.com/zlplease/policyObservation
  • 小组人数:9

二、冲刺概况汇报

吴振溢:

  • 过去一天完成了哪些任务

    • 更改数据结构,便于接口接入。

  • 接下来的计划

    • 等待接口并接入。
  • 还剩下哪些任务

    • wait interface
  • 燃尽图

  • 遇到了哪些困难

    暂无。

  • 有哪些收获和疑问

    暂无

  • PSP & 学习进度条(学习进度条每日追加)

    PSP:

    PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
    Planning 计划
    · Estimate · 估计这个任务需要多少时间 5 5
    Development 开发
    · Analysis · 需求分析 (包括学习新技术) - -
    · Design Spec · 生成设计文档 - -
    · Design Review · 设计复审 - -
    · Coding Standard · 代码规范 (为目前的开发制定合适的规范) - -
    · Design · 具体设计 - -
    · Coding · 具体编码 30 60
    · Code Review · 代码复审 10 10
    · Test · 测试(自我测试,修改代码,提交修改) 10 10
    Reporting 报告
    · Test Repor · 测试报告 - -
    · Size Measurement · 计算工作量 - -
    · Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 5 5
    · 合计 60 90

    学习进度表:

    第N次 新增代码(行) 累计代码(行) 本次学习耗时(小时) 累计学习耗时(小时) 重要成长
    1 52 52 60 60 更改数据结构,便于接口接入。

陈宇扬:

  • 过去两天完成了哪些任务:

    • 完成剩下省份爬取的可行性分析
    • 完成西藏、四川内容爬取
  • 接下来计划:

    • 完成剩下省份政策文件的获取。
  • 还剩下哪些任务:

    • 其他省份政策相关获取;
  • 燃尽图:

  • 遇到了哪些困难:

    • 尝试爬取吉林省时,不知道是什么原因(估计是设了反爬取机制),请求发过去后,给我们返回了个这东西:
    • 有一些省份的网站貌似没有完成,搜索功能不可用。
    • 四川省的政策文件库不完整,搜索“通知”返回的第一页下面显示页数有117页,但在进入第二页后下面显示的页数就只有37页了。
  • 有哪些收获和疑问:

    • 有些省份可以通过网络活动的XHR获取信息,有些存在文档内,不易获取。
  • PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划
· Estimate · 估计这个任务需要多少时间 10 10
Development 开发
· Analysis · 需求分析 (包括学习新技术) 40 60
· Design Spec · 生成设计文档 - -
· Design Review · 设计复审 - -
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 5 5
· Design · 具体设计 - -
· Coding · 具体编码 150 140
· Code Review · 代码复审 10 10
· Test · 测试(自我测试,修改代码,提交修改) 5 5
Reporting 报告
· Test Repor · 测试报告 - -
· Size Measurement · 计算工作量 10 10
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 10 15
合计 240 255
  • 学习进度表
第N轮次 新增代码(行) 累计代码(行) 本周学习耗时(小时) 累计学习耗时(小时) 重要成长
1(beta) 200 200 4.25 4.25 完成四川、西藏政策文件爬取

张乐芃:

  • 过去一天完成了哪些任务:

    • 整理项目结构,增加注释
  • 接下来计划:

    • 接口接入
  • 还剩下哪些任务:

    • 前后端联调
    • 部署上线
  • 燃尽图:

  • 遇到了哪些困难:
    • 暂无
  • 有哪些收获和疑问:
    • 收获:暂无
    • 疑问:怎么才能估计好工期
  • PSP表格
PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 10 10
Estimate 估计这个任务需要多少时间 5 10
Development 开发 - -
Analysis 需求分析 &ppt&(包括学习新技术) 20 20
Design Spec 生成设计文档 - -
Design Review 设计复审 - -
Coding Standard 代码规范 (为目前的开发制定合适的规范)
Design 具体设计 30 30
Coding 具体编码 30 20
Code Review 代码复审 20 20
Test 测试(自我测试,修改代码,提交修改) - -
Reporting 报告 - -
Test Repor 测试报告 - -
100Size Measurement 计算工作量 5 5
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 10 10
Total 合计 130 125
  • 学习进度表
第N轮次 新增代码(行) 累计代码(行) 本次学习耗时(小时) 累计学习耗时(小时) 重要成长
1 100 100 2 2 新增注释

潘春佳:

  • 过去两天完成了哪些任务:
    博客文本编辑

  • GitHub签入记录:

  • 接下来计划:
    博客文档编辑

  • 还剩下哪些任务:
    ppt报告编写

  • 燃尽图

  • 遇到了哪些困难:
    时间紧凑,需要学习的太多

  • 有哪些收获和疑问:
    报告太频繁

  • PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 10 10
· Estimate · 估计这个任务需要多少时间 8 10
Development 开发
· Analysis · 需求分析 (包括学习新技术) 5 5
· Design Spec · 生成设计文档 20 20
· Design Review · 设计复审 - -
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) - -
· Design · 具体设计 - -
· Coding · 具体编码 - -
· Code Review · 代码复审 - -
· Test · 测试(自我测试,修改代码,提交修改) - -
Reporting 报告 60 65
· Test Repor · 测试报告 - -
· Size Measurement · 计算工作量 5 5
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 5 5
· 合计 113 120
  • 学习进度表
第N次 新增代码(行) 累计代码(行) 本次学习耗时(小时) 累计学习耗时(小时) 重要成长
1 0 0 3 3 学习新知识

蔡树峰:

  • 过去两天完成了哪些任务

    • alpha冲刺总结

    • 学习

    • 展示GitHub当日代码/文档签入记录

      暂无

  • 接下来的计划

    • 准备项目推广任务
  • 还剩下哪些任务

    • 做视频
    • 推广
  • 燃尽图

  • 遇到了哪些困难

    又有考试来了

  • 有哪些收获和疑问

    队友们太给力了

  • PSP & 学习进度条(学习进度条每周追加)

    PSP:

    PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
    Planning 计划 10 10
    · Estimate · 估计这个任务需要多少时间 5 5
    Development 开发 - -
    · Analysis · 需求分析 (包括学习新技术) 10 10
    · Design Spec · 生成设计文档 - -
    · Design Review · 设计复审 - -
    · Coding Standard · 代码规范 (为目前的开发制定合适的规范) - -
    · Design · 具体设计 - -
    · Coding · 具体编码 - -
    · Code Review · 代码复审 - -
    · Test · 测试(自我测试,修改代码,提交修改) - -
    Reporting 报告 40 40
    · Test Repor · 测试报告 - -
    · Size Measurement · 计算工作量 5 5
    · Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 5 5
    · 合计 75 75

    学习进度表:

    第N次 新增代码(行) 累计代码(行) 本次学习耗时(小时) 累计学习耗时(小时) 重要成长
    1 0 0 3 3 -

周伟杰:

  • 过去一天完成了哪些任务:

    • 对接口返回结果进行一些筛选
  • Github签入记录:

    • 暂无
  • 接下来计划:

    • 部署上线
  • 还剩下哪些任务:

    • 继续调试
    • 部署上线
  • 燃尽图:

  • 遇到了哪些困难:
    • 暂无
  • 有哪些收获和疑问:
    • 收获:暂无
    • 疑问:时间有点紧
  • PSP表格
PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 10 10
Estimate 估计这个任务需要多少时间 10 10
Development 开发 - -
Analysis 需求分析 &ppt&(包括学习新技术) 60 80
Design Spec 生成设计文档 - -
Design Review 设计复审 - -
Coding Standard 代码规范 (为目前的开发制定合适的规范)
Design 具体设计 30 30
Coding 具体编码 20 40
Code Review 代码复审 10 10
Test 测试(自我测试,修改代码,提交修改) - -
Reporting 报告 15 15
Test Repor 测试报告 - -
100Size Measurement 计算工作量 5 5
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 10 10
Total 合计 115 125
  • 学习进度表
第N轮次 新增代码(行) 累计代码(行) 本次学习耗时(小时) 累计学习耗时(小时) 重要成长
1 20 20 2 2 结果筛选

周浩东

  • 过去两天完成了哪些任务:

    • 知识抽取
  • github签入记录

  • 接下来计划:
    • 知识推理和部署
  • 还剩下哪些任务:
    • 知识推理和部署
  • 燃尽图

  • 遇到了哪些困难:
    • 数据量太大
  • 有哪些收获和疑问:
    • 知道自己电脑的极限在哪里
  • PSP表格
PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 20 10
Estimate 估计这个任务需要多少时间 20 20
Development 开发 - -
Analysis 需求分析 &ppt&(包括学习新技术) 10 10
Design Spec 生成设计文档 - -
Design Review 设计复审 - -
Coding Standard 代码规范 (为目前的开发制定合适的规范)
Design 具体设计 10 5
Coding 具体编码 60 30
Code Review 代码复审 30 30
Test 测试(自我测试,修改代码,提交修改) - -
Reporting 报告 - -
Test Repor 测试报告 - -
100Size Measurement 计算工作量 5 5
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 10 10
Total 合计 95 100
  • 学习进度表
第N轮次 新增代码(行) 累计代码(行) 本周学习耗时(小时) 累计学习耗时(小时) 重要成长
1(beta) 200 200 3 3 知识抽取

林蒋辉

  • 过去两天完成了哪些任务:

    • IK分词器和pinyin分词器测试使用
    • GitHub签入记录
  • 还剩下哪些任务:

    • 热点词汇和词频统计实现
  • 燃尽图:

  • 遇到了哪些困难:

    • 分词器返回的结果有小部分不是很合理,没找到合适的解决方案
  • 有哪些收获和疑问:

    • 学会了分词器使用
  • PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划
· Estimate · 估计这个任务需要多少时间 10 10
Development 开发
· Analysis · 需求分析 (包括学习新技术) 30 30
· Design Spec · 生成设计文档 - -
· Design Review · 设计复审 - -
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 5 5
· Design · 具体设计 - -
· Coding · 具体编码 100 100
· Code Review · 代码复审 40 30
· Test · 测试(自我测试,修改代码,提交修改) 150 150
Reporting 报告
· Test Repor · 测试报告 - -
· Size Measurement · 计算工作量 10 10
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 10 10
合计 355 345
  • 学习进度表
第N轮次 新增代码(行) 累计代码(行) 本周学习耗时(小时) 累计学习耗时(小时) 重要成长
1(beta) 300 300 5 5 分词器使用

黄朝威:

  • 过去一天完成了哪些任务:
    • 完成剩下省份爬取的可行性分析
    • 完成对重庆市、国务院及其部门、河南省整省、陕西省整省、天津直辖市的爬取,以及收获了吉林省的警告。
  • 接下来计划:
    • 完成剩下省份政策文件的获取。
  • 还剩下哪些任务:
    • 其他省份政策相关获取;
  • 燃尽图:
  • 遇到了哪些困难:
    • 尝试爬取吉林省时,可能是吉林省对于这部分内容管控比较严格,也算是失误应该在爬取前用爬虫协议查看能否爬取过于着急了,请求发过去后,给我们返回了个这东西:
    • 有一些省份的网站貌似没有完成,搜索功能不可用。
    • 部分省份文件库需要输入内容才能使用这样会可能会一定程度少减少爬取的数量,但文件库提供了便捷的获取途径,尝试绕开不可取。
  • 有哪些收获和疑问:
    • 有些省份可以通过网络活动的XHR获取信息,有些存在文档内,不易获取。
  • PSP表格
PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划
· Estimate · 估计这个任务需要多少时间 10 10
Development 开发
· Analysis · 需求分析 (包括学习新技术) 40 60
· Design Spec · 生成设计文档 - -
· Design Review · 设计复审 - -
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 5 50
· Design · 具体设计 - -
· Coding · 具体编码 300 420
· Code Review · 代码复审 10 10
· Test · 测试(自我测试,修改代码,提交修改) 5 5
Reporting 报告
· Test Repor · 测试报告 - -
· Size Measurement · 计算工作量 10 10
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 10
合计 390 585
  • 学习进度条
第N轮次 新增代码(行) 累计代码(行) 本周学习耗时(小时) 累计学习耗时(小时) 重要成长
1(beta) 961 961 12 12 完成对重庆市、国务院及其部门、河南省整省、陕西省整省、天津直辖市的爬取

三、冲刺成果展示

  • 展示组内最新成果

    最近爬取成果:

    福建省政策数据及其抽取后数据整理导出:

分批导入Apache Jena Fuseki进行API接口查询和知识推理:

  • 站立会议合照

  • 会议耗时记录
第N次会议 耗时(分钟)
1 10