avatar

李沅罡

南加州大学.计算机科学硕士 | 专注于云计算、机器学习和分布式系统领域 | 全栈工程师

专业经验
软件研发工程师 | USC iLab实验室 洛杉矶,加州 2023年3月 – 2023年8月
Python, MLOps, Docker, Github Action, Pytorch, Pytest
  • 设计和开发用于深度学习研究的框架,用于加速消融实验的研究Ablator
  • 该框架被USC的30多位研究人员使用,在开发过程中提交了70+ Pull Request,开源贡献排名第二
  • 使用GitHub Actions创建CI/CD Pipeline,涵盖静态分析、测试、代码覆盖率和包管理。
  • 使用Pytest框架编写测试用例,实现了95%以上的覆盖率。
  • 立开发了一个在PyPI发布的RClone(一款云文件同步工具)的Python API Pacakge,内含RClone二进制文件,使得在各操作系统上无需预先安装RClone即可使用,并提供自动二进制文件选择以方便用户使用。 python-rclone

云平台研发工程师 | 商汤科技 北京,中国 2022年1月 – 2022年12月
Kubernetes, Docker, Go, CI/CD, CRD, Operator-SDK, Helm3, Prometheus, Grafana
  • 参与商汤科技AI大装置的云平台研发,主要负责在SaaS平台上提供RocketMQ集群服务,提供完全托管的消息中间件集群,实时监控,自动扩展,以及滚动更新,使RocketMQ服务创建速度提高了150%
  • 使用Operator SDK构建了基于Kubernetes的RocketMQ Operator和自定义资源定义(CRD),在基于kubernetes的云环境中自动部署和管理RocketMQ集群。 
  • 使用Bash和Python开发了脚本和自动化工具,以简化Rocket MQ的部署过程。使用Helm3将相关资源打包成Helm charts进行分发,简化了部署过程并增强了资源管理的灵活性。还实施了GitLab CI/CD以自动化单元测试,容器图像构建,和Helm Chart更新,使开发速度提高了30%。
  • 使用PrometheusGrafana和其他监控工具监控并维持Rocket MQ集群的健康和性能。支持服务实例性能指标和操作状态的实时收集,分析和可视化。
  • 探索Kubernetes相关技术,包括:Helm3、Docker、ContainerdrunC容器运行时,为云平台提供更好的服务。
  • 将Kubernetes上使用CRD和Operator SDK部署Rocket MQ的整个过程写成文档,并与团队成员分享,以确保知识迁移和协作。

软件研发工程师 | 中国科学院软件研究所 北京,中国 2021年5月– 2021年8月
Docker, Node.js, JSON, Vue.js, RobotFramework
  • 参与研发基于网络的自动测试工具,使用录制和回放技术。该工具允许记录、编辑、执行、分析和生成测试用例中用户操作的结果。
  • 使用Node.js将JSON格式记录的用户操作转换为Robot Framework脚本,实现了95%的操作转换覆盖率,从而促进回放测试。
  • 使用Docker容器化程序,并自动化了DevOps流程,提高了开发效率。
  • 使用Vue.js和AceEditor创建自定义组件和布局,提高了前端的用户体验。
  • 该工具的部署每周节省了超过15小时的时间,并将端到端测试效率提高了300%

后端开发 | 小牛翻译(北京)科技有限公司 北京,中国 2021年1月– 2021年4月
Java, SpringBoot, Spring, Java Persistence API, Maven, Nginx, MySQL, Git, Java Application
  • 使用Java/Spring/Maven开发了一个AI文档翻译系统,独立开发了一个吸引了30,000 MAUs的PDF/XML模块,并使用NginxGit进行性能优化。