全国统一咨询服务专线
400-683-6883
您所在的位置: 背景提升 > 科研实训-机器学习

科研实训-机器学习

实验报告 推荐信

适合人群:大学生,研究生

活动时间: ——

简介:项目日期:第一阶段:2周远程辅导:了解项目背景,文献阅读,资料收集第二阶段:1周实地实习:每天9:00-16:30第三阶段:2周远程辅导:完成

  • 活动详情
项目日期:

第一阶段:2周远程辅导:了解项目背景,文献阅读,资料收集

第二阶段:1周实地实习:每天9:00-16:30

第三阶段:2周远程辅导:完成实验报告

注:远程辅导是指导师利用邮件、QQ等进行任务布置、讲解和答疑。每周导师与学生沟通1-2次,每次1-2小时。具体时间可灵活安排。

实习地点:北京 中关村

关联专业:计算机,软件

实验方向:机器学习,数据挖掘,文本挖掘

实习成果:实验报告+推荐信

录取标准:简历审核+电话面试(注:学生需具有一定编程基础matlab/Python)

项目简介:基于机器学习的文本聚类是对文本进行无监督的学习过程。本课题基于聚类技术,能够实现对批量文档的聚类过程,从而发现其中的主题,在网络安全领域可用于发现邮件中的事件线索。课题涉及机器学习,数据挖掘等相关技术对文本进行词频统计,向量化表示,降维处理,聚类分析。实习过程中采用理论与实践结合的方式,培养学生对文本挖掘的兴趣,提高对文本的分析能力。

项目内容:

 

时间 内容
2周远程辅导 项目背景了解,文献阅读,编程训练
1周实地实习:每天9:00-16:30 Day1: 文本聚类技术
l 常用文本聚类技术
l k-means算法介绍
Project 1对文档进行向量化表示
Day2: 主题建模技术
l PLSA算法介绍
l LDA算法介绍
Project 2实现k-means算法
Day3: 内容安全技术
l 内容安全介绍
l 典型应用案例介绍
l 常用技术
Project 3实现PLSA算法
Day4: 文本聚类在内容安全领域的应用
l 隐秘通信
l 主题模型在内容安全领域的应用
Project 4:利用LDA算法找到文本主题
Day5: 基于文本聚类的邮件数据分析
l 分析邮件数据
l 展示分析结果
l 项目开放问题讨论与下阶段任务布置
2周远程辅导 完成实验剩余部分,并完成实验报告。
1. 继续在某数据集基础上,用pagerank算法找比较重要的几个人,从主题词中分析人物特点,职务等信息
2. 利用公开的中文语料库,比如搜狗语料库,做文本分类,计算下分类精度,对比不同算法的精度,效率

学生反馈查看更多

相关推荐查看更多

您的测试已提交

美世留学老师将在第一时间联系您,告知测试结果

请保持手机畅通

确定

请勿重复提交

确定
×
  • 小学
  • 初中
  • 高一高二
  • 高三
  • 大一大二
  • 大三大四
  • 美国
  • 英国
  • 加拿大
  • 澳大利亚
  • 新加坡
  • 中国香港
  • 其他国家
  • 准备中
  • 成绩优异
  • 成绩中等
  • 成绩一般
  • 成绩优异
  • 成绩中等
  • 成绩一般