李柯毅 Keyi Li

Stay focused, stay positive

专业技能

熟练PythonExcelSQL等数据分析工具

掌握RPowerpoint等可视化工具

了解机器学习深度学习等算法框架

了解 Linuxs 命令行爬虫Matlab

自学过HtmlCSSJava等简单的前端技术

其他技能

高分通过四六级TOFEL 108GRE 328

围棋业余五段国家二级运动员北京大学围棋协会会员

实践经历

东方证券 互联网传媒组

2023.4~2023.7 企业实习

跟踪大模型最新动态,爬取并整理每日新闻

阅读并总结openAI大模型大部分论文

协助完成人工智能行业研究,负责大模型部分的撰写和整理

博裕资本 二级市场

2023.7~2023.11 企业实习

行业研究:负责新能源(自动驾驶)汽车行业分析和新股研究,重点关注重卡相关公司

数据采集:利用EDA、CMD、WIND、Visible Alpha等数据库完成调研和数据收集整理

数据分析:利用excel对数据进行可视化;清洗并提取关键信息以建立模型,预测各项销量及财务指标的变化趋势

UCHICAGO-PKU联合暑校

2023.7~2023.8 暑期学校

四人团队项目负责人,研究非标债数据分析,个人主要负责数据爬取以及定量分析

数据来源为Wind数据库、政府网站、企业预警通,数据分析采用Excel

项目获评优秀并得到展示机会(4/14),赢得加分奖励,最终总评A+

Worldquant Brain

2023.10 实践学习

北京大学HFA与Worldquant联合项目,通过两周的课程学习Alpha因子设计和挖掘的技巧,并在Worldquant Brain平台上进行实践

成功挖掘并提交五个Alpha因子,在Worldquant Challenge中得到7754分并获得 银牌

获奖情况

全国大学生数学竞赛

2023 年

北京赛区二等奖 全国二等奖

奖励奖学金

2023 年

奖励: 北京大学三好学生北京大学学习优秀奖优秀共青团员

奖学金: 北京大学CASC二等奖学金地质一等奖学金

项目经历

基于机器学习的创业协助系统

项目描述:利用机器学习方法,为创业者提供创业选择、公司管理、融资预测、破产预警等各项创业协助服务与洞察

项目概况:Python;机器学习(SVM、随机森林等)、深度学习(CNN,AutoEncoder等);数据可视化

具体工作:①创业相关数据清洗及特征工程;②利用CNN及AutoEncoder解构并预测人脸图像的B5性格,建模给出创业匹配度③A-E轮融资情况及公司经营情况预测

赠你一份"避鲨计"

项目描述:全球鲨鱼袭击数据分析,洞察鲨鱼袭击的特点和倾向性,并给出避免鲨鱼袭击的建议

项目概况:R(ggplot2);统计分析与描述分析;数据可视化

具体工作①收集鲨鱼袭击数据并清洗;②绘制热力交叉表、气泡图等分析袭击特点;③利用地图等分析鲨鱼袭击时空频率

基于数据库的旅游路线定制系统——Tourist

2024.2~now

项目描述:利用微博苏州签到数据库推介个性化旅游路线,并做可视化

项目概况:MySQL+Python;统计分析建模;有约束的最短路线算法等

具体工作:①在百万级数据库中提取景点等信息,进行数据清洗与特征提取;②结合统计分析与情感分析确定景点评分,公式建模选定每日旅游景点; ③结合Folium与PYQT5图形框架,实现动态地图窗口可视化与用户个性化选择;④遗传算法规划最短路线并智能化选定周边旅店饭店

制氢成本数据分析及预测

2023.4~now

项目描述:本研项目,收集论文中制氢路径的成本数据并分析,同时预测未来成本并根据减排目标选择最佳路径

项目概况:Excel+python;论文爬虫;建模与时序预测;数据可视化

具体工作:①爬取论文中数据并清洗整理;②设计新型成本框架;③建模预测至2100年各路线氢能预期投资;④对比传统成本建模并做敏感性分析

其他项目

基于慕课大数据的分析

展示链接 👈

个人课程项目,利用python和Weka完成慕课大数据的聚类、神经网络预测,获得慕课学生表现与成绩的关联; 作业获得满分,并荣获优秀作业

俄罗斯方块对战版算法开发 ⚡

展示链接 👈

数据与结构与算法课程的大作业项目,五人团队完成算法开发 主要负责连消策略时间策略的开发以及调参、验证工作 团队荣获第四名(4/50)

机器学习方法实现单斜辉石温压计

预览链接 👈

机器学习方法提升地球化学研究,提高传统方法温压计的精度,并通过automl实现了误差的降低

简历框架参考gitee平台 https://gitee.com/wu-sili/resume