菜码编程

  • 首页
  • 隐私政策
图片分类
使用卷积神经网络识别图片内容并分类
人工智能

[项目实战] 基于MFCC和CNN的语音情感识别系统

本项目是一个基于深度学习的语音情感识别系统,使用 PyTorch 实现。该系统能够从音频中识别 6 种不同的情感状态:愤怒、恐惧、开心、中性、悲伤和惊讶。项目包含完整的数据处理、模型训练、评估流程,并提供友好的图形用户界面(GUI)进行实时预测。数据集来源于百度 AI Studio 的情感语音数据集,包含 300 条 .wav 格式的音频文件。模型支持 ResNet18 和 ResNet34 等架构,并可选择原始波形或 MFCC 频谱图作为输入特征。系统提供了丰富的评估指标(如准确率、F1 分数、混淆矩阵等)以及自…

2025年 3月 6日 0条评论 2661点热度 0人点赞 Caima Coding 阅读全文
人工智能

基于注意力机制的ResNet18网络架构的眼疾识别

本文介绍了一个基于机器学习的眼疾识别系统,使用了ResNet18和ResNet18-NAM两种卷积神经网络模型来对眼底图像进行分类,以实现自动眼疾识别。通过对两个公开数据集 iChallenge-PM 和 眼病分类数据集 的部分数据进行处理,并将其调整为 224x224 的图像尺寸。文章重点研究了基于注意力机制的ResNet18-NAM模型,其中引入了NAM(归一化注意力机制)以增强模型的注意力计算能力。实验结果表明,ResNet18-NAM在准确率和模型效率上优于标准ResNet18,并且在多项指标上均表现出较好…

2024年 8月 11日 0条评论 1089点热度 0人点赞 Marlone 阅读全文
菜码Coding

分享编程实战经验|实战项目

分类
  • Matplotlib教程 / 3篇
  • 人工智能 / 7篇
  • 前端开发笔记 / 3篇
  • 后端开发笔记 / 3篇
  • 图像处理 / 3篇
  • 图片分类 / 2篇
  • 学习笔记 / 4篇
  • 未分类 / 3篇
  • 机器学习 / 1篇
  • 点云处理 / 2篇
  • 计算机网络 / 4篇
  • 计算机视觉 / 5篇
  • 论文 / 1篇
网站信息统计
  • 文章总数:23 篇
  • 评论数目:5 条
  • 标签总数:17 个
  • 浏览次数:48161 次
  • 友链总数:0 个
  • 用户总数:26 个
  • 运行天数:752 天
  • 建站时间:2023-06-04
  • 最后更新:2025-03-12
  • 数据查询:42 次
  • 生成耗时:0.16206秒

COPYRIGHT © 2024 菜码编程. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

豫ICP备2024080801号