零碎事件记录

零碎事件记录

2024-05-31：
- 使用YOLO8训练一个识别水印的模型（yolo8-watermark-brand）；
- 创建一个自动移除水印的Demo：yolo8-plus-iopaint，使用YOLO8+IOPaint搭配使用，由YOLO8自动定位水印位置，然后使用IOPaint移除水印。
2024-05-29：首次本地运行了ChatTTS + 初步运行了ros2的gazebo仿真器。
2024-05-28：安装docker版ros2。
2024-05-27：主要发布比较正式的github pages+迁移samgeai.com域名并绑定github pages。
2024-05-23：新增爬虫别名配置的导出脚本+爬虫别名的批量上传更新功能。
2024-05-13：首次打包并发布了pypi的pip安装包：samge-fork-scrapyd.
2024-05-11：成功将fastgpt的版本从v4.6.3迁移到v4.8 + 升级one-api到最新版本。
2024-05-10：添加ii函数咩的个人信息到github私有库并集成到fastgpt中构建私有模型应用 + 整理并测试comfyui的api并上传到github。
2024-05-09：进一步熟悉bootstrap并改造xx站点的注册登录页面交互跟兑换码的交互。
2024-05-08：完善vscode翻译插件的功能，保留多行翻译展示 + 增加（替换/在文后追加）
2024-04-29：02:22完成了xx功能新增：api接口的加密解密 + js的加密解密，强化接口的破解难度 + 抽取xx中onclick的js函数为根据id绑定点击事件，避免js混淆后无法识别 + 将paddleocr封装为api调用。
2024-04-28：成功使用paddleocr完成图片中电话号码提取。
2024-04-24：抽取科技快讯的抓取到爬虫框架。
2024-04-22：成功用go的开源库完成获取验证码前的图形验证码功能。首次使用开源的小红书爬虫，抓取小红书内容。
2024-04-16：完善xx的注册功能（加入邮箱验证码）+加深对redis的使用认识。
2024-04-11：首次用go对接minio的开源oss功能.
2024-04-09：首次使用ddg执行go gin的模板开发 + 首次使用portainet-agent管理多台机子上的docker资源。
2024-04-04：首次完成upwork的个人认证，并提交第一个upword的提案。
2024-03-31：首次打通独角数卡+易支付的个人支付通道（微信+支付宝+qq）。
2024-03-28：首次部署个人支付发卡平台-独角数卡，为后续打通个人支付闭环作准备 + 首次使用hexo+github pages部署静态站点。
2024-03-22：完成xx的数据抓取+真实下载链接的抓取，为xx付费下载功能添砖加瓦。
2024-03-19：对java的maven仓库pom.xml依赖管理有了进一步的认识。
2024-03-18：今天完成了xx下载站的链接解析功能+界面构建。
2024-03-17：首次使用音乐高潮部分提取功能+将该功能应用到数字人生成上面。
2024-03-14：首次使用spleeter进行音频的人声分离+使用whisper进行音频的字幕提取，二者都对接到自己的api接口中，形成阶段性的一块奠基石。
2024-03-13：首次根据抖音分享信息自动解析并下载音视频+驱动数字人合成。
2024-03-09：首次使用flv完成在http端进行视频拉流播放。
2024-03-06：首次使用视频推流功能，初步完成OBS推流，http推流还需要调试。
2024-03-05：数字人对接GPT-Sovits的克隆音色+初步在app端对接数字人接口。
2024-03-04：成功安装GPT-Sovits的环境依赖并成功进行训练+推理，初步感觉推理速度跟效果挺不错。
2024-03-03：完成数字人训练的一键脚本，方便后续快速训练数字人。
2024-02-28：初步完成数字人推理的api接口，后续对接其他的接口完成功能整合闭环。
2024-02-27：将之前的数字人训练跟推理代码整理抽离重构，后续可以整成api使用了.
2024-02-23：因再次遇到conda的envs环境损坏提示不支持的16位程序问题，改用docker容器方式进行映射开发调试，这应该会逐步成为后续的开发主方向。
2024-02-19：首次使用安卓的jetpack compose构建布局。
2024-02-18：增加docker中指定字体的经验 + 将今日科技快讯的本地部署功能完善并打包到可用的docker镜像中，后续部署到远程服务器。首次使用python工具，将视频的不同场景进行切分。虽然有的场景还是存在粘黏，但符合自己的工具库需求。
2024-02-08：修复app对接视频接口的checkbox错乱问题+增加新数字人的训练+app视频下载并自动复制文案 + 更换ubuntu的网卡驱动，修复无法识别有线网卡的问题。
2024-02-07：回家过年前的凌晨，在凌晨4点终于完成app跟接口的对接，由app获取今日科技快讯列表，然后自主选择生成视频，在手机端下载视频并复制文案。这可以让我在回家的假期里，即使脱离电脑，也能完成视频的发布任务。
2024-02-04：更新1年前写的微信机器人代码，那时候由于被封号就没碰了，今天又重新挂上号并搭配内网部署的大模型，主要用来接收消息而不是发消息。
2024-02-03：更新vscode翻译插件代码，增加短词快捷翻译功能，即没选中文本的情况下快速翻译光标左侧连续中文文本。
2024-02-01：初步完成modnet的图片/视频抠图的api，实现上传文件或base64完成抠图后返回限时下载的url链接。同时实现了建议的task模式，提交任务后立即返回taskid，后台定时任务对待处理任务进行调度并修改状态。另外，初步使用vscode完成文件上次的的接口调试，感觉使用vscode调试接口挺方便的 + 使用vscode的launch.json构建fastjson的debug断点调试配置，对vscode 断点调试有进一步的认识。
2024-01-31：完成panddle api的开发，功能有多文转音频、合并、音频链接下载/base64。
2024-01-30：完成百度飞桨paddle的docker镜像制作（cpu+gpu），目前对pytorch、百度飞桨、魔塔社区模型都有了比较熟地环境搭建及推理能力，后续可能再学习一下tf跟yoyo。另外，今天也使用paddlespeech完成tts的服务端跟客户端互联，并测试了流式音频的生成，边生成边播放，为后续的直播或机器人及时交流项目做准备。其实想要构建一个即时对话机器人，可以即时沟通，记录我的内容，还可以学习英语等。
2024-01-29：vscode插件成功完成了百度、阿里、火山、有道、腾讯、deepl这六家翻译引擎的集成。
2024-01-27：08:19，首次制作vscode插件并成功发布第一个vscode插件到官方插件商店：Vscode Samge Translate 翻译助手。之所以开发并发布这个，是因为没有符合自己需求的插件，于是搭配gpt，一天从0到1完成插件开发，对vscode的熟练度又增加了一些。
2024-01-25：初步完成从接口获取资讯》筛选科技类型资讯》文本生成图片》图片+音频生成