如何评价2023年美赛C题？

日期：2024-02-13 07:56:33 栏目：体育新闻浏览：85 评论：0

　　建议先看看我的这篇文章：2023美国大学生数学建模竞赛C题思路解析（含代码+数据可视化）

　　选题建议、ABCDEF题参考文献、ABCDEF题思路（后续更新视频和代码）、D题数据、数据集及处理方式已更新，其他日内更新。

　　下文包含：2023年美国大学生数学建模竞赛（以下简称美赛）A - F题思路解析、选题建议、代码可视化、比赛的最新规则变化、比赛的分工建议及如何准备美国大学生数学建模竞赛

　　最新的更新思路、代码等可以看我的这篇文章：2023美国大学生数学建模竞赛（美赛）思路助攻汇总

　　选题建议如下：2023美国大学生数学建模竞赛选题建议

　　A-F题思路如下：

　　E题思路：（示例）2023美国大学生数学建模竞赛E题思路解析

　　其他题目：2023美国大学生数学建模竞赛（美赛）思路助攻汇总

　　如下是部分整理的参考文献：

　　很高兴，美赛的的回答帮助了上千队伍，下面展示了去年美赛的回答：2022年美赛C题思路

　　下面将给到大家一些团队的国一选手之前的参赛经历及如何准备数学建模竞赛的方法：

　　本文非常适合各个阶段的建模er观看，干货满满！（超详细攻略，完整版在下方回答）：如何评价2022年数学建模国赛？

　　如下为2023美赛的分工建议：

　　比赛时间：2023年2月17日 6:00 ~ 2月21日 9:00

　　一、赛前一天，16日

　　17日晚上，保证充足睡眠。

　　二、比赛第一天，17日

　　选题阶段：

　　6:00下载和翻译题目，半小时内每个人翻译2个题目，建议自行翻译后结合网上翻译，因为网上最早的都是机翻，关键数据和点位有可能与题意有出入。

　　7:00整理翻译，确定最佳翻译。

　　7:20每人各自查看6个翻译好的题目，至少读3遍。然后记录下每道题目的关键词、模型、算法、可能的假设，评估题目的难度。抓住每一条灵感，初步查阅部分资料，延伸思路。

　　12:00午饭后小组集合，讨论对每道题目的理解、合适的模型、可能的算法，结合队伍能力选择出2个意向题。

　　13:30针对这2个题，三人一起再次读题，进一步查阅资料，从中确定1个为最终选题。

　　资料搜索：

　　14:00开始上网，收集资料，美赛赛题开放性很大，需要花费更多时间来搜集资料。最终模型、论文的水平与阅读、查找资料的多少有直接关系，所以要舍得花时间查阅资料。

　　17:00完成资料搜集，深入讨论相关资料、模型、算法。

　　讨论初步模型：

　　18:00开始讨论确定基础模型。

　　21:00前共同确定基础模型方案。

　　初步计算结果：

　　21:00负责写作的同学开始中文写作，编写模型，借助参考文献对模型进行深入思考，简化和优化。负责编程的同学开始编写核心代码，最好在睡觉前得到初步计算结果。

　　二、比赛第二天，18日

　　7:00开始用初始结果重新考量已构建的模型，重新审视你的方法并重新运行结果，简化模型假设，用背景调查研究的成果证明你的假设成立。

　　17:00前要举全队之力完成论文的主要部分，该画图的画图，该出数据的出数据。

　　22:00前主要写作任务和程序代码完成，撰写模型优缺点和结论部分。

　　三、比赛第三天，19日

　　7:00针对模型的缺点不足，竭尽所能去完善它。

　　12:00在论文初稿的基础上，不断补充对模型的优化部分。

　　22:00前必须得到完整的结果并完成论文大部。如果可能，写出摘要的初稿。

　　23:00准备好论文的附录，包括附加的图片、表格、程序等。

　　四、比赛第四天，20日

　　7:00开始检验模型灵敏度及优化模型。其优化模型必须占到论文的三分之一。

　　12:00前完成模型优化及灵敏度分析工作。中午适当休息，因为今晚上应该是一个不眠之夜。

　　15:00开始翻译论文，可以使用“钞能力”找翻译公司，但千万别找专门的建模比赛辅助翻译，因为没准你的论文会被转手售卖，导致最终论文不合格。

　　20:00开始三人共同检查论文，并且提出各种修改意见，检查标点、公式等问题，逐步完善摘要。

　　五、比赛第五天，21日

　　5:00前至少论文初稿全文修改三遍以上。切忌语法表达使用中式英语。最后检查排版的细节问题。

　　7:00提早上传最终稿，避免因为网络拥堵提交失败！

　　提交成功后，马上休息。前事不忘，后事之师啊，避免像我一样因为熬夜，休息不好引起感冒。

　　六、比赛后一天，22日

　　如果这场美赛不是你参加的最后一场建模，那么在赛后需要一起开个会，总结本次竞赛中的得失。

　　总体来看与去年的C题比较相似，唯一一道有数据（不需要自己额外找）的题目，选题人估计也最多。

　　本质是数据分析题目，需要建立预测模型、分类模型、特征挖掘等。相对来说出思路比较简单，想出彩比较难。所以在分析建模时一定要多维度思考，不然连页数都凑不够。大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!

　　题目要求：

　　《纽约时报》已经要求你对此文件中的结果进行分析，以回答几个问题。

　　•1.报告的结果的数量每天都在变化。开发一个模型来解释这种变化，并使用您的模型为2023年3月1日报告的结果数量创建一个预测区间。单词的任何属性是否会影响在困难模式下玩家的分数的百分比？如果是，如何处理？如果不是，为什么不呢？

　　这一问要求对数据表中的数据进行分析和解释说明，总结变化规律，并选择合适的预测模型对未来数据进行预测。这里题目指出预测结果应该是一个区间，这说明传统的回归拟合预测不能满足题目要求，需要进行改进或者直接使用基于统计学的区间预测方法。

　　同时我们还需要分析单词的属性，给出的单词量虽然并不大，但直接对单词进行属性分析需要较深的NLP知识，不好切入。不妨我们可以从结果入手，求出每个单词选择困难模式的玩家平均解题次数作为特征变量进行聚类分析，得到少、适中、多三个或更多的类别，然后可以生成词云图观察对应类别中的词分布特点。分布特点可以人为构造，如统计各个字母出现频次，aeiou元音字母占比（aeiou存在少的往往生僻），重复字母个数（按照题目困难模式下拥有重复的字母会好猜）。分析聚类是否在以上特点中存在显著的分布趋势，即可得到结论。

　　如果有影响，就在出题中减少这类单词。无影响，说明情况即可。

　　•2.对于未来日期的给定未来解决方案词，开发一个模型，允许您预测报告结果的分布。换句话说，来预测未来一个日期的（1、2、3、4、5、6、X）的相关百分比。你的模型和预测有哪些不确定性？举一个你在2023年3月1日预测eerie这个词的具体例子。你对你的模型的预测有多有信心？

　　结合问题一的结论开发预测模型，直接将已知数据其输入预测模型进行训练，调整优化参数后得到预测模型，将新词已知条件输入，输出（1、2、3、4、5、6、X）的值，最后将结果进行归一化处理。（按照3问，该题不需要考虑难易程度）

　　测量模型的不确定性可以采用蒙特卡罗Dropout法（MC Dropout）和深度集成法。

　　•3.开发和总结一个模型，按难度分类解决方案词。识别与每个分类关联的给定单词的属性。使用你的模型，怪诞这个词有多难？讨论你的分类模型的准确性。

　　结合问题一的结论开发预测模型，根据eerie词的特点去给该题的难易程度打分，显而易见，该词并不是一个常见的词汇，难度系数较高。生僻词可以作为一个评价维度，然后用问题一的分布特点作为其他评价指标，用综合评价法求出得分作为词的标签。其他已知词的难以标签则由聚类结果（对应平均分）决定。接着将其输入预测模型进行训练，输出（1、2、3、4、5、6、X）的值，最后将结果进行归一化处理。

　　测量模型的不确定性可以采用蒙特卡罗Dropout法（MC Dropout）和深度集成法，预测信心可以用训练集的准确率、AUC值来验证，也可以添加噪声来验证模型鲁棒性。

　　•4.列出并描述了这个数据集的其他一些有趣的特性。最后，在一封给《纽约时报》拼图编辑的一到两页的信中总结你的结果。

　　数据分析+可视化+总结结果

　　需要请关注，题主正在写~

　　2023数学建模美赛C题Predicting Wordle Results(预测单词)思路和程序分享，已完成全部分析获取链接：https://mbd.pub/o/bread/ZJWWk5xp大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!

　　在这里插入图片描述

　　更新时间：2023-2-19 15:30BetterBench：2023年美赛C题预测Wordle结果这题太简单了吧BetterBench：2023年美赛C题Wordle预测问题一建模及Python代码详细讲解BetterBench：2023年美赛C题Wordle预测问题二建模及Python代码详细讲解BetterBench：2023年美赛C题Wordle预测问题三、四建模及Python代码详细讲解

　　代码运行环境编译器：vsCode 编程语言：Python 如果要运行代码，出现错误了，不要着急，百度一下错误，一般都是哪个包没有安装，用conda命令或者pip命令都能安装上。

　　第一小问，建立一个时间序列预测模型，首先对数据按先后顺序排序，查看数据分布

　　在这里插入图片描述

　　（1）查看数据分布

　　在这里插入图片描述

　　（2）使用箱线图进行查看异常值，300000以上是异常值，黑色的，需要进行处理，本代码中采用的向前填充法，就是用异常值前一天的数据来填充。

　　在这里插入图片描述

　　（3）因为Number of reported results是数值特征，在线性回归模型中，为了取得更好的建模效果，在建立回归评估模型之前，应该检查确认样本的分布，如果符合正态分布，则这种训练集是及其理想的，否则应该补充完善训练集或者通过技术手段对训练集进行优化。由KDE图和Q-Q图可知，价格属性呈右偏分布且不服从正态部分，在回归之前需要对数据进一步数据转换。

　　转换前

　　在这里插入图片描述

　　转换后，注意，预测得到的结果，还要转换回来，采用指数转换。公式是log(x) =y,x=e^y。

　　在这里插入图片描述

　　（4）可视化所有特征与label的相关性，采用皮尔逊相关性方法，筛选相关性较高作为数据集的特征。得到41个特征。

　　在这里插入图片描述

　　（5）划分数据集前，需要标准化特征数据，标准化后，将1-11月的数据作为训练集，12月的数据作为测试集。可以看到用简单线性回归可以拟合曲线。

　　在这里插入图片描述

　　（5）采用线性回归

　　模型误差是RMSE: 1992.293296317915

　　模型训练和预测

　　在这里插入图片描述

　　预测得到的结果减去误差，得到预测区间的左边界，加上误差，得到预测区间的右边界。最后得出的预测区间是【18578-22562】

　　我提取了每个单词中每个字母位置的特征（如a编码为1，b编码为2，c编码为3依次类推，z编码为26，那5个单词的位置就填入相应的数值，类似于ont-hot编码）、元音的字母的频率（五个单词中元音字母出现了几次），辅音字母的频率（5个单词中辅音字母出现了几次），还有一个是单词的词性（形容词，副词，名词等等，这部分没有做）

　　特征在代码中未这几个：'w1','w2','w3','w4','w5','Vowel_fre','Consonant_fre'

　　然后分别计算1-7次尝试百分比与这几个特征的相关性，采用皮尔逊相关性方法。同学们，继续对图片中的数值进行解读，应用到论文中，可以用表格阐述。

　　在这里插入图片描述

　　{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6, 'g': 7, 'h': 8, 'i': 9, 'j': 10, 'k': 11, 'l': 12, 'm': 13, 'n': 14, 'o': 15, 'p': 16, 'q': 17, 'r': 18, 's': 19, 't': 20, 'u': 21, 'v': 22, 'w': 23, 'x': 24, 'y': 25, 'z': 26}

　　在这里插入图片描述

　　（1）统计元音辅音频率

　　在这里插入图片描述

　　（2）分析相关性

　　在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

　　剩下的问题二、三、四代码实现，在我主页查看，陆续发布出来。

　　这是一道关于蔬菜类商品的自动定价与补货决策的数学建模题目。题目信息包括:蔬菜类商品保鲜期短,品相随时间变差,因此需要根据销售情况进行定价和补货决策。提供了一家商超6个蔬菜品类的商品信息、2020-2023年销售数据、批发价格和损耗率数据。需建立数学模型,分析蔬菜品类之间的关联及销量分布规律,给出一个星期的品类补货量和定价策略。需控制单品总数在27-33个,给出单品补货量和定价策略。需考虑还需要采集哪些数据以制定补货和定价决策。

　　本题目需要应用数学统计方法分析销量规律,建立优化模型确定补货量和定价,综合考虑销量、成本、收益等因素。需要收集和分析更多影响需求的因素数据。

　　随着生鲜市场的竞争日益加剧，合理的库存和定价策略对于商超的运营变得至关重要。在这个分析中，我们探讨了如何基于过去的销售数据、批发价格和商品损耗率来预测蔬菜品类的未来销售，并据此提供补货和定价建议。

　　我们首先分析了每种蔬菜品类的历史销售数据，使用移动平均法预测了它们在未来一周的销售量。考虑到商品的损耗率，我们调整了预测的销售量来计算补货量。对于定价策略，我们使用了“成本加成定价”方法，基于最新的批发价格为每种品类和单品设置了零售价格。

　　在单品补货分析中，我们特别关注了22种最受欢迎的单品。这些单品是基于最近一周的销售数据选出的。我们为这些单品提供了补货量预测，并根据批发价格和20%的加成比例为它们提供了定价策略。

　　我们得到了蔬菜品类和22种单品在未来一周的补货和定价建议。这些建议可以帮助商超优化库存，避免过度库存和缺货，并确保商品的定价与市场需求相匹配。

　　通过对历史销售数据的深入分析，我们可以为商超提供有关未来销售、补货和定价的有价值的见解。然而，这些建议是基于历史数据的，实际的市场反馈和销售可能会有所不同。因此，商超在执行这些建议时应保持灵活性，并根据实际情况进行调整。此外，为了更精确地预测未来的销售和需求，商超可以考虑收集更多的市场和消费者数据，并应用更复杂的预测模型。

　　关键词：补货策略、定价策略、销售预测、蔬菜品类、单品分析。

　　模型建立:数据预处理: 首先，对销售流水明细数据进行处理，统计每天每种蔬菜的销售量。关联分析：使用关联规则学习方法，例如Apriori算法，找出輀菜之间的关联关系。销售分布规律：使用时间序列分析，例如ARIMA模型，对每种疏菜的销售量进行分析，预测未来销售趋势。

　　模型表示：设 $X_{i j}$ 表示第 $\mathrm{i}$ 天第种䓇菜的销售量。通过时间序列分析，我们可以得到:

　　 $X_{i j}=f(T, \theta) \\$

　　其中，是时间， $\theta$ 是模型参数。

　　模型建立:需求预测：使用时间序列分析的方法，预测未来一周每种蔬菜的销售量。成本加成定价模型: 设定价 P_j 为:

　　 $P_j=C_j \times(1+\alpha) \\$

　　其中， C_j 是第j种蔬菜的成本， $\alpha$ 是加成比例。

　　收益最大化模型：目标是最大化商超的总收益：

　　 $\max \sum_j\left(P_j-C_j\right) \times X_{i j} \\$

　　模型建立：需求预测：使用时间序列分析的方法，预测未来一天每种蔬菜的销售量。单品选择模型：根据预测的销售量和损耗率，选择27-33种销售量最大的蔬菜。收益最大化模型: 与问题 2 类似，目标是最大化商超的总收益，但此时是针对单品进行优化。顾客偏好数据：了解顾客对哪些蔬菜有更强烈的需求。季节性因素数据: 了解不同季节对蔬菜需求的影响。竞争对手数据：了解竞争对手的定价策略和补货策略。宏观经济数据：了解经济状况对蔬菜销售的影响。

　　这些数据可以帮助商超更准确地预测蔬菜的需求，制定更合理的补货和定价策略。

　　先导入数据

　　我们使用统计分析和可视化工具来探索蔬菜各品类及单品销售量的分布规律及相互关系。大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!