科研实训-机器学习
阅读量:2200项目日期:
*阶段:2周远程辅导:了解项目背景,文献阅读,资料收集
第二阶段:1周实地实习:每天9:00-16:30
第三阶段:2周远程辅导:完成实验报告
注:远程辅导是指导师利用邮件、QQ等进行任务布置、讲解和答疑。每周导师与学生沟通1-2次,每次1-2小时。具体时间可灵活安排。
实习地点:北京 中关村
关联专业:计算机,软件
实验方向:机器学习,数据挖掘,文本挖掘
实习成果:实验报告+推荐信
录取标准:简历审核+电话面试(注:学生需具有一定编程基础matlab/Python)
项目简介:基于机器学习的文本聚类是对文本进行无监督的学习过程。本课题基于聚类技术,能够实现对批量文档的聚类过程,从而发现其中的主题,在网络安全领域可用于发现邮件中的事件线索。课题涉及机器学习,数据挖掘等相关技术对文本进行词频统计,向量化表示,降维处理,聚类分析。实习过程中采用理论与实践结合的方式,培养学生对文本挖掘的兴趣,提高对文本的分析能力。
项目内容:
时间 | 内容 |
2周远程辅导 | 项目背景了解,文献阅读,编程训练 |
1周实地实习:每天9:00-16:30 | Day1: 文本聚类技术 l 常用文本聚类技术 l k-means算法介绍 Project 1:对文档进行向量化表示 |
Day2: 主题建模技术 l PLSA算法介绍 l LDA算法介绍 Project 2:实现k-means算法 |
|
Day3: 内容安全技术 l 内容安全介绍 l 典型应用案例介绍 l 常用技术 Project 3:实现PLSA算法 |
|
Day4: 文本聚类在内容安全领域的应用 l 隐秘通信 l 主题模型在内容安全领域的应用 Project 4:利用LDA算法找到文本主题 |
|
Day5: 基于文本聚类的邮件数据分析 l 分析邮件数据 l 展示分析结果 l 项目开放问题讨论与下阶段任务布置 |
|
2周远程辅导 | 完成实验剩余部分,并完成实验报告。 1. 继续在某数据集基础上,用pagerank算法找比较重要的几个人,从主题词中分析人物特点,职务等信息 2. 利用公开的中文语料库,比如搜狗语料库,做文本分类,计算下分类精度,对比不同算法的精度,效* |

在线匹配专属背景提升项目
全新录取
火爆项目推荐
为什么选择美世教育
国际教育10余载
深耕国际教育行业10余载。发展至今,在北上广深等12个国内城市及美国、日本设立直属分公司及全球客户服务中心
菁英导师优势
TOP10等世界高校
背景导师
科学智能系统
职业发展智能测评系统
导师匹配与管控系统
智能选校系统
接轨世界高校
目前已帮助众多学子成功
申请到世界高校offer
保持开放的态度,与国际接轨
培养中国学子的全球胜任力
美国高校直接合作
斯坦福,宾大等
多名藤校前招生官
为美世学子服务
超级福利!测一测适合你留学的国家
你适合去哪个国家留学
A
B
C
D