求解两道概率题型及解题方法题

点击联系发帖人 时间：2022-10-28 04:55

概率题型及解题方法

高顿为您提供一对一解答服务，关于考研数学三此题第二问的各个概率如何取？我的回答如下：

以上是关于考研,考研数学三相关问题的解答，希望对你有所帮助，如有其它疑问想快速被解答可在线咨询或添加老师微信。

}

这几天一直在写22真题解析的稿子，所以今天来写一下22考研数学真题的解题体验~

先说一下整体的感受，相比2021年的题，今年的难度略微还是有所提升的，在难度设计上更加平衡了，计算量也提高了很多~思考难度上并不是很大，几乎没有像2020年的那种难题。 这种难度的提升其实应该是可以接受的，不会让大家觉得一下子摸不着头脑。

当然，有些题目也是出乎意料的，有让人拍案叫好的出乎意料，也有让人恨得牙痒痒的出乎意料~不过都很正常，每年的真题出来，都是让人出乎意料的，这就是出题老师的高明之处吧。

不过有一种感觉是，自从21年大纲改革，新的真题与旧的真题有一大不同就是，计算量明显提升，尤其是小题，很多小题都是需要一定计算的，而大题的变化相对较少，思考难度上没有太大跨越，计算量上，总体来说略有所提升。 整张卷子的风格就是，更加注重计算了。可能这也是应了考试分析所说的，要坚持标准，出有区分度的题。有一定综合性且有一定的计算量的题，目前看来，是最有区分度的了。

选择题泾渭分明，考概念的题，几乎都可以秒，但却也有不少实打实考计算的，能用选择题技巧的不多。写解析的时候感触比较大，线代选择题，其实找到答案很容易的，但出于写解析的目的，经常喜欢举反例，找反例其实比找答案要难。这一点其实给我们一个启发，概念，结论要记就一定要记准确，不要模棱两可，在考场上坚定一点直接用是最快的。

填空题相对都比较基本，都是一些需要掌握好的基本计算，有一两道比较值得一提的我稍后会说。

总体来说，解答题的层次拿捏得很好。每道题考得都比较扎实，就像看武侠片武打时那种拳拳到肉的感觉。

数一、数二终于找回了失去的证明题，高数压轴题出得非常好，不落俗套。要注意，它要求证明“充分必要性”，而非仅仅必要性。必要性的证明，其实在2018年的数二、数三真题的选择题当中就出现过了。我当时讲真题，也讲了证明方法，说这道题，也可以出大题，出大题的话，你们可以这样做~~~~

数三没有证明题，都是计算，且是常规计算。但是稍微想吐槽一下，感觉这次数三的解答题有点用力过猛，计算量有些偏大了。

最主要的槽点是第18题。列出算驻点的算式很简单，但是把驻点算出来，要经过重重阻碍，包括但并不限于解这样一个一元二次方程. 用求根公式算，需要会试根，或者，在得到这个一元二次方程前先转化系数。无论是哪种，要在考场上算完其实都蛮考验人的。

去年的题总体简单，但是线代和概率题其实相对是比较新的，而高数部分就比较基础，平平无奇。但今年的感觉是，高数部分出得比去年新，更有层次，而线代和概率则偏常规，题量也比较少，体现不出丰富的层次。

下面我们具体来谈谈数一、数二、数三的试卷特点与值得一说的题目。

数一的选择题的2/7/8/9/10其实都属于偏计算的选择题，其余的相对偏概念，概念清晰的话，解题会比较快，不清晰的话可能会比较费劲。第4题有一些计算，但找对路子的话其实并不复杂。

从这里可以看出，数一对高数、线代的考查偏重于概念部分，对概率的考查主要还是基本定义和计算。

个人觉得第(3)题和第(6)题是出得比较好的题目。

第(3)题，看起来是比较唬人的，其实考的点是复合极限以及数列极限与函数极限的关系。出题老师用了惯用的相似障眼法，让辨别选项之间的关系提高了难度。但这道题的考法在2017年数二是出现过的，应该算是一个升级版。

第(7)题，方程组同解问题。分块矩阵又改头换面地出现了，去年是考秩，今年是考方程组。这里的话，抓住解的概念去做题。出题老师没有套路就是最大的套路。

其余的概念题，像第(5)题，概念清楚的话基本上属于秒杀题。做题和写解析不一样，找到正确答案可能只需要3秒，但是全面解析可能要写30分钟。

第(4)题出得也不错，常规的定积分比大小的题目。做题时要注意观察，首先能看出来和

的比较是容易的，直接泰勒写一写，扔掉小o就可以出结果，保险起见，作差构造不等式也可以。与它们的比较就需要从大处着眼了，与在这里其实是扮演了相似的角色，都不超过2，所以的被积函数是比较明显地大于的，这就拉开了和的差距，反而是很快就能出结果了。

第(9)题是冷门考点切比雪夫不等式有关的题。今年我们的数一模拟题也有一道这个考点的题，不过真题出得比我们的题更加综合一点，考到了平方的均值的估计，所以要用到2阶矩与4阶矩。

第(10)题其实是一道比较恶心的题，计算量不小。

一种办法是直接凑二维正态分布的概率密度.

但这个可能很多同学记不清。

还有一种办法就是直接计算相关系数。先算联合概率密度，然后计算，再算边缘概率密度，得到服从，从而，进一步得到. 这种办法计算量更大。

不论是哪种办法，都不会让人太舒服。

填空题都是基本计算题。

(11)老生常谈了，函数在一点处的最大方向导数是该点处的梯度的模。这个点我从基础班开始就在强调，一个很好的数一仅有的极值问题出题点，2015年，2019年都考了，这次只考了一道填空题，没有计算量，基本属于送分。当然，这个点，我们今年的模拟题也有一道题。

(12)定积分计算。换元或分部都可以做。

(13)填空题中出得相对难一点的一道题，实际上为二元函数在有边界的平面区域上的最值问题。可能有不少同学在做题时会忽略掉边界上的最值情况导致失分。

(14)函数项级数的收敛域。2021年考了一道函数项级数的收敛域与和函数的解答题，这次又考函数项级数，数一同学的专属福利吗？当然，就解题而言，题目并不难。

(15)好久不见的矩阵运算。

(16)常规的随机事件的概率计算。

解答题的出法有点像2016年，不过难度上应该是比2016年的数一解答题低的。之所以说像2016，是因为数一很少出现单独考二重积分的题，而2016年考了。

数一的解答题其实也一直在寻求新的出题点，像曲线、曲面积分这一块，19年，20年两年其实都是比较新的面孔，22年这道其实又相对来说反常规。

前两道(17)，(18)是常规题。

第(19)题，是一道好题，平平无奇的曲线积分，只要基础扎实，不要投机取巧走捷径，都能算好，且计算量不大，直接算亦可，用斯托克斯公式亦可。但如果一看到空间曲线积分就只知道“降维”，那可能就要丢分了。那种情况，对不是由平面截出来的曲线不适用。所以，像这种题，还是得把基本方法打扎实了才行。

第(20)题，也是一道好压轴题。这是一道一元微积分的综合题，主要是考凹凸性的充分必要条件。必要性的证明可以用泰勒公式，也可以利用变限积分构造函数不等式，而充分性的证明，要注意到二阶连续导数这个条件，利用连续性与极限的定义来构造反证法的反例。想到这一点，那就不难，但考场上如果审题不清楚，只做了必要性的部分，或者没有能够想到二阶连续导数这个条件的话，就会丢一半分了。如果没有二阶连续导数这个条件，这个命题仍然正确，但证明难度就大大增加了。 这也是出题老师的高明之处。

总体来说，高数部分的解答题，层次是比较分明的，前两道属于基本题，会算就能得分，后两道相对不那么常规，尤其是压轴题，没有套路可言，但是考查范围又全不超过，非常新颖灵活。

线代解答题属于常规题，基本属于2005年数一真题的复刻。

数一的这道线代解答题其实没有数二、数三的新。

概率解答题也是常规题，无非是要由均值(期望)写出概率密度函数，再写似然函数，再算最大似然估计量。其实我都没想过，只有一道概率大题的话，会这样重度考查最大似然估计，毕竟去年都被扔进小题了。。。我之所以会觉得出乎意料，主要是觉得这道题更偏统计，对概率部分考查过少。

与数一一样，数二的选择题的概念与计算也是基本一半一半，1/3/5/6/8都属于概念题，其余偏计算。

第(6)题和第(7)题数一也考了。分别是数一的第(3)题和第(4)题，就不再多赘述了。

第(1)题主要考无穷小量与符号，这种考法其实只在曾经的数三真题中见过，2013年数三考了一道考含义的题。

第(3)题出得非常好，对一阶导、二阶导的考查很到位，第一次出现了如果举反例需要举二阶导不连续的例子，当然，考场上只需要做对题即可，即用对结论，我们反复强调过，一点处的导数符号不能决定该点附近的函数性质，一阶导符号不能决定单调性，二阶导符号不能决定凹凸性。当然，题目迷惑人的地方就在于，背了这个结论会发现B和D是一样的，该选谁就需要回头注意到二阶导数存在（意味着附近一阶导数连续）这个条件了。

基于这个点，数二的题目其实又出现了重复的考点，就是与高数压轴题当中，充分性的证明要使用极限的定义或者保号性这一点重复了。这是一个小小的遗憾。

第(5)题，带两个瑕点的反常积分审敛，其实这种题应该不能算陌生了，虽然2021年反常积分审敛法才被纳入大纲，但是2010年数一数二考得比这道更难，2016年数一那道也比这道难，以后反常积分审敛可能会更频繁地出现。

偏计算的题目就不再多说了。有具体想了解的同学可以发评论交流。

数二的填空题就更没有什么新意了，都是计算，会算就能得分，计算能力不太好的话就比较吃亏。

除了第(13)，(16)题的考法可能在近年出现较少外，另外4道都是老熟人了。

第(13)题，上一次考是在1999年数二真题中，考的是不定积分。不过今年数三也出了一道与这道题平行的题，比较之下，数二这道设计的更好些。

这类题的一个特点就是方法很基本，但计算起来比较繁琐。我在基础班是仔细讲过的，下面这些基本就是基础班讲的内容。

被积函数为有理函数，形如，其中被积函数的分母为没有实根的二次三项式，分子为一次多项式.

对此类积分，可以拆分为两种基本类型.

总而言之，方法都是基本方法，但要能碰到题就能做对，还是需要多动手算多练习。

第(16)题其实也就是计算，虽然以前没考过，但所有考点都是基本考点，就是算起来比较冗长而已，我个人不是很喜欢这样的题。。。不如去年的线代填空题。

高数部分和数一感觉比较类似，一共5道高数解答题，前3道属于比较基本的，后2道略微拉开差距。

第(20)题是比较综合的多元微分题，第(1)问主要考链式法则的基本运用，第(2)问需要大家会用换元找表达式，这种考法其实在2004年数三真题有一道很类似的填空题。求出表达式后，算极值也是基本计算了。

第(21)题压轴题和数一一样，我就不再重复了。

线代解答题说新也新，说不新也不新。说新是因为这种考法在往年真题中没出现过，说不新是因为其实这种考法很多模拟题已经出过了。其实这种考法是二次型中一种非常经典的问题，在同济线代课后习题中都有出现过。

(同济第六版第五章第30题)证明：二次型在时的最大值为矩阵的最大特征值.

不过我们的模拟题并没有出这个点，我们也出了一个最值，是与正定矩阵有关的>_<大家不要看到最值就误会了。。。

总体来说，数一和数二的题画风是比较接近的，有同考点同源的题，像数一第(13)题和数二第(20)题，算完后会发现其实二元函数是同一个。

总体来说，数三今年给我的感觉比较颠覆，都说数三要向数一、数二看齐，但是我感觉今年某些题目有些超过了。

选择题还好，前两道题让我有一种梦回2013，2014的感觉，连续两道来自于函数、极限考概念的题，让我有些恍惚。

这种考查概念的题，近十年还真就是数三出了，所以今年的这套卷，一开始，很数三！

其余的部分，高数与线代部分选择题，数三的题几乎都是来自数一、数二。也就是说，高数和线代，该算的，一点都不会少。

(4)同数一第4题，数二第7题

(7)同数一第7题，数二第10题

概率选择题与数一没有一道相同的，除了冷门考点辛钦大数定律与依概率收敛之外，应该没有特别有难度的，同样地，还是得保证基本计算。概率选择题也都基本考计算。。。

填空题也是从头算到尾。

第(12)题对数三是一个意外。这种定积分计算题，以前基本只在数一和数二考，而且数一数二也很少两种类型结合在一起考，数三这次一次性到位了。

其余的计算，其实也都还算常规。只能说，这次考计算，出题老师是玩真的。

数三这次没有考证明题，和去年一样，6道解答题都是计算题，不过线代和概率题的计算量相比去年降低了，而高数部分的计算量提高了。

第(17)题与数一一样，是微分方程与渐近线的粘合题，先解微分方程求函数表达式再算渐近线，是属于基本题。

第(18)题看起来平平无奇，但实则暗藏杀机。都知道要算驻点，可是算驻点却一点都不容易。

分别计算关于和的偏导数.

要解这个方程组得到驻点，得先得到，然后代入再化简得到，然后整理变成一元二次方程求解。过程比较恶心，就不写在这里了。

感觉这道题是有意设计成这样的，系数凑得也挺巧，就是不想让我们算得轻松。

第(19)题二重积分题是常规题，同数一第18题，数二第19题，在极坐标系下分区域算比较简单。

第(20)题是求幂级数的和函数的常规计算题，与去年相比，难度上并没有本质变化。没有太大新意。

线代解答题与概率解答题分别与数二、数一的一样，就不重复了。

回顾完2022的真题，我们简单谈一下这3张卷子带给我们的启示。

考试分析一直说，我们要坚持标准，要出有高区分度的题。我想，通过21年和22年这两年的真题，对这句话的解读应该是，具有一定计算量的综合题，应该是最有区分度的题，以后的题目，应该也会像今年的数一、数二题一样，该常规的常规，该逐步拉开层次的拉开层次，该压轴的压轴，各司其职.

复习过程中打好基础，解答题至少前2道或3道是没问题的，线代、概率常规题是能下手的。高数如果难一点，那么线代和概率可能就能稍微放水一点，不会全部为难大家。在思考难度上难为大家的可能就一道题，复习时没有必要为了这12分的小树放弃掉整片基础分的森林。

小题的拿分，反倒是没有大纲改革前那么容易了。选择题不能总想着秒杀了，有些题必须得老老实实算。当然，碰到概念题的话，概念清晰该秒还是得秒。填空题，计算量整体提高了。

这样看起来，大题也是算，小题也是算。我们平时复习的时候，计算一定要重视起来，基本计算要练得炉火纯青，上了考场再紧张都不会算错。这样才稳。

最后，新的一年，我们继续加油~

PS：因为不太想在这篇文章中加入图片影响手机上的观看效果，所以里面提到的一些题目并没有放进来。如果想看比较完整的带题目的版本，可以看我的知乎专栏文章。/p/

}

2022 年一季度的尾声，在这个季度中，你是否担忧自己错过了哪些重要的技术工作？抑或想要检验下自己是不是在这一季度又有了哪些基础知识的增长？

本篇是机器之心「虎卷er行动 · 春卷er」的第一卷，旨在为老伙计们汇总并逐一盘点2022年开春以来机器之心编辑部报道发现的社区热议的技术工作，并回顾近期举办的国际AI顶会的最佳论文。

2022春季热议工作：16项

2022春季国际顶会最佳论文：10篇

2022 春季 · 机器之心报道社区热议工作

热议工作1：阿里达摩院语音实验室提出了一种具有线性复杂度 (O(N)) 的计算模型 PoNet

本文的出发点基于 Transformer 模型中 Self-attention 机制相对于句子长度的复杂度是二次的(O(N^2))，因此在计算速度和显存空间方面都制约了它在长序列中的应用。PoNet ，使用 Pooling 网络替代 Self-attention 机制对句子词汇进行混合，从而捕捉上下文信息。

热议工作3：B 站开源超分辨率算法 Real-CUGAN，可以把动画图像的质量提升 2 到 4 倍

该项目来自 bilibili 人工智能实验室。据作者介绍，Real-CUGAN 是一个使用百万级动漫数据进行训练的，结构与 Waifu2x 兼容的通用动漫图像超分辨率模型。相比目前市面上已有的通用化超分辨率算法，Real-CUGAN 的 AI 模型经过了更大体量数据集的训练，处理二次元内容的效果更佳。

该研究者将 AlphaCode 放在 Codeforces 挑战中进行了测试，Codeforces 是一个具有竞争力的编程平台，它类似于国际象棋中使用的 Elo 评级系统，每周分享编程挑战和问题排名。

不同于编程人员在打造商业应用程序时可能面临的任务，Codeforces 的挑战更加独立，需要对计算机科学中的算法和理论概念有更广泛的了解，一般是结合逻辑、数学和编码专业知识的非常专业的难题。

热议工作12：为了自动驾驶，谷歌用 NeRF 在虚拟世界中重建了旧金山市

训练自动驾驶系统需要高精地图，海量的数据和虚拟环境，每家致力于此方向的科技公司都有自己的方法，Waymo 有自己的自动驾驶出租车队，英伟达创建了用于大规模训练的虚拟环境 NVIDIA DRIVE Sim 平台。

2022年初，来自 Google AI 和谷歌自家自动驾驶公司 Waymo 的研究人员实践了一个新思路，他们尝试用 280 万张街景照片重建出整片旧金山市区的 3D 环境。

Block-NeRF 是一种神经辐射场的变体，可以表征大规模环境。具体来说，该研究表明，当扩展 NeRF 以渲染跨越多个街区的城市场景时，将场景分解为多个单独训练的 NeRF 至关重要。这种分解将渲染时间与场景大小分离，使渲染能够扩展到任意大的环境，并允许对环境进行逐块更新。

热议工作15：不可思议！英伟达新技术训练 NeRF 模型最快只需 5 秒，单张 RTX 3090 实时渲染，已开源

NeRF 是在 2020 年由来自加州大学伯克利分校、谷歌、加州大学圣地亚哥分校的研究者提出，其能够将 2D 图像转 3D 模型，可以利用少数几张静态图像生成多视角的逼真 3D 图像。之后又出现了改进版模型 NeRF-W（NeRF in the Wild），可以适应充满光线变化以及遮挡的户外环境。

然而，NeRF 的效果是非常消耗算力的：例如每帧图要渲染 30 秒，模型用单个 GPU 要训练一天。因此，后续的研究都在算力成本方面进行了改进，尤其是渲染方面。

最佳论文1：巴黎第九大学、法国国家科学研究中心、Meta AI 等提出了一种样本高效算法理论上保证推荐系统不会降低用户体验（Outstanding Paper Award）

推荐系统正面临审查，因为它们对用户的影响越来越大。当前的公平审计仅限于敏感群体级别的粗粒度奇偶校验评估。该研究建议审计应该「envy-freeness」，这是一个与个人偏好一致的更细化的标准：每个用户都应该更喜欢符合自己的推荐而不是其他用户的推荐。由于「envy」审计需要估计用户现有推荐之外的偏好。

该研究提出了一种样本高效算法，理论上保证推荐系统不会降低用户体验。此外，他们还研究了所提方法在现实世界推荐数据集上可以实现的权衡。

下图为审计场景：审计员要么在当前推荐中向用户展示他们的推荐系统，或通过向其他用户显示推荐来进行探索：

该研究提出的 OCEF 算法流程如下所示：

中科院自动化所兴军亮研究员领导的博弈学习研究组提出了一种高水平轻量化的两人无限注德州扑克 AI 程序——AlphaHoldem。其决策速度较 DeepStack 速度提升超 1000 倍，与高水平德州扑克选手对抗的结果表明其已经达到了人类专业玩家水平，相关工作已被 AAAI 2022 接收。

中国科学院自动化研究所兴军亮研究员领导的博弈学习研究组在德州扑克 AI 方面取得了重要进展，提出了一种高水平轻量化的两人无限注德州扑克 AI 程序AlphaHoldem。AlphaHoldem 整体上采用一种精心设计的伪孪生网络架构，并将一种改进的深度强化学习算法与一种新型的自博弈学习算法相结合，在不借助任何领域知识的情况下，直接从牌面信息端到端地学习候选动作进行决策。

最佳论文3：荷语布鲁塞尔自由大学、隆德大学等在切割平面证明系统的基础上开发了一种用于优化问题的认证方法（Distinguished Papers）

对称性和支配性的打破对于解决困难的组合搜索和优化问题至关重要，但这些技术的正确性有时依赖于微妙的论证。

该工作在切割平面证明系统的基础上，开发了一种用于优化问题的认证方法，其中对称性和支配性的突破很容易表达。

实验评估表明可以有效地验证完全通用的对称性破缺在布尔可满足性（SAT）求解中有效地验证了全面的对称性突破，从而首次了一个统一的方法来证明一系列先进的 SAT 技术的统一认证方法，其中还包括 XOR 和心数推理。

此外，该研究提出的方法应还可应用于最大剪裁求解和约束性编程作为概念证明，该方法适用于更广泛的组合。

该研究对 House Allocation Model 中激发偏好的任务进行了探索。以 Hosseini 等人[AAAI'21]的最新模型为基础，该工作重点研究了激发偏好的任务，以找到必然最优的匹配，即在所激发的偏好的所有可能完成情况下的最优。

本文遵循 Hosseini 等人的方法，研究了必然帕累托最优（NPO）和必然等级最优（NRM）匹配的诱导，回答了他们的开放性问题，并给出了在次优查询模型中引出NRM 匹配的在线算法。

该算法具有 3/2 的竞争性，也就是说，它最多只需要最优算法的 3/2 的查询次数。除此之外，该研究还通过引入两个新的自然诱导模型和研究确定其中是否存在必然的最优匹配的复杂性，以及给出这些模型的在线算法来扩展这一研究领域。

最佳论文5：拉德堡德大学、牛津大学等针对安全关键环境下运行的自主系统控制器的随机扰动提出了一种新的规划方法（Distinguished Papers）

在安全关键环境下运行的自主系统的控制器必须考虑到随机扰动。这种干扰通常被建模为过程噪声，常见的假设是基础分布是已知的和/或高斯的。然而，在实践中，这些假设可能是不现实的，并可能导致真实噪声分布的近似度很低。

该工作提出了一种新的规划方法，它不依赖于噪声分布的任何明确表示，特别是解决了计算控制器的问题，该控制器为安全到达目标提供了概率上的保证。

作者提出将连续系统抽象为一个离散状态模型，通过状态间的概率转换来捕获噪声。作为一个关键的贡献，该工作采用了场景方法的工具来计算这些过渡概率的可能近似正确（PAC）的界限，基于有限数量的噪声样本，并在所谓的区间马尔科夫决策过程（iMDP）的过渡概率区间中捕获这些界限。

这个 iMDP 对过渡概率的不确定性是稳健的，而且概率区间的紧密度可以通过样本的数量来控制。本文使用最先进的验证技术为 iMDP 提供保证，并计算出一个控制器，这些保证会延续到自治系统中。现实的基准显示了本文方法的实际适用性，即使 iMDP 有数百万个状态或转换。

最佳论文6：安德烈斯·贝洛大学、瓦尔帕莱索大学等提出了一种新的解集子集近似的方法，可被用作任何时候双目标搜索算法的基础（Distinguished Papers）

在双目标搜索中得到一个图，其中每个有向弧都与一对非负权重相关联，目标是找到帕累托最优解集。但在许多实际环境中，这个集合太大，因此其计算非常耗时。此外，尽管双目标搜索算法是逐步生成帕累托集的，但它们是详尽地生成的。这意味着在搜索的早期，解集的覆盖面并不多样，而是集中在解集的一个小区域。

为了解决这个问题，本文提出了一种新的解集子集近似的方法，它可以被用作任何时候双目标搜索算法的基础。本文的方法将给定的任务转化为一个使用两个真实参数的目标双目标搜索任务。对于每个特定的参数设置，目标任务的解决方案是原始任务的解决方案集的一个子集。根据所使用的参数，目标任务的解集可以很快被计算出来。这在具有挑战性的路线图基准中，可以在比计算解集所需时间小几个数量级的时间内获得丰富多样的解。

本文表明，通过以适当的参数序列运行该算法，获得了一个不断增长的解决方案序列，该序列收敛于全部解决方案集。

Cumulative 约束极大地促进了约束性编程在解决调度问题方面的成功。然而，SoftCumulative 是 Cumulative 约束的一个版本，在这个版本中，资源过载会产生惩罚。

该工作为 SoftCumulative 引入了一个检查器和一个过滤算法，其灵感来自于Cumulative 的能量推理规则。这两种算法都可以用于经典的线性惩罚函数，也可以用于二次惩罚函数，即资源超载的惩罚随着超载量的增加而呈二次增长。

该工作表明，这些算法比现有的算法更通用，在实践中优于 SoftCumulative 的分解。

最佳论文8：巴黎 - 萨克雷大学提出了一系列未经训练的指标 InfoLM ，显著改进了文本摘要和 Data2Text 生成任务的许多配置，并获得了超过 10 点的相关增益（Outstanding Student Paper）

通过人工注释评估自然语言生成系统质量的方法成本非常高，并且非常耗时。因此在实践中，研究人员大多依靠自动指标来评估模型质量。

过去十年，领域内涌现出许多基于字符串的指标（例如 BLEU）。但是，此类指标通常依赖于精确的匹配，因此不能稳健地处理同义词。基于此，该研究提出了一系列未经训练的指标 InfoLM，这些指标可被视为基于字符串的指标，但借助预训练掩码语言模型解决了上述缺陷。这些指标还利用信息度量，允许 InfoLM 适应各种评估标准。

该研究使用直接评估证明了 InfoLM 显著改进了文本摘要和 Data2Text 生成任务的许多配置，并获得了超过 10 点的相关增益。

最佳论文9：加拿大拉瓦尔大学、加拿大高等研究院展示了如何在MNIST数据集的分类任务的主动学习中考虑和学习注释成本（Best Student Abstract）

深度学习是一个很有前途的途径，可以使生物医学成像的繁琐分析任务自动化。然而，它在这种情况下的应用受到了训练深度学习模型所需的大量标注数据的限制。

虽然主动学习可以用来减少标记数据的数量，但许多方法并没有考虑到注释的成本，而这在生物医学成像环境中往往是非常重要的。在这项工作中，本文展示了如何在 MNIST 数据集的分类任务的主动学习中考虑和学习注释成本。

最佳论文10：密歇根大学展示了交互式任务学习智能体 Rosie 的演示，它通过设置自然语言指令让智能体学习在模拟环境中执行巡逻任务（Best Demonstration Award）

该研究展示了交互式任务学习智能体 Rosie 的演示，它通过设置自然语言指令让智能体学习在模拟环境中执行巡逻任务。执行过程中，Rosie 建立了一个相当大的任务层次结构，包括先天和后天学习任务、制定为实现目标或遵循程序的任务、具有条件分支和循环的任务以及涉及交流和心理活动的任务组成。

Rosie 在 Soar 认知架构中实现，并使用声明性任务网络表示任务，通过 chunking 将其编译成程序规则，这是让 Rosie 从单个训练集中学习并快速泛化的关键。

，我们基于「 AI人必追」的本季度举办的国际顶会及机器之心报道中的社区热议工作，「炼丹者必备」的基准数据集、AI顶会挑战赛优胜算法及开发基础知识，共同设计了由60道选择题构成的「虎卷er · 春榜试题」，并编撰了 3 套独家配套技术复习资料，帮助关注前沿AI技术发展的开发者梳理第一季度的重要 AI 技术工作的同时帮助注重实践技能的开发者快速温故知新，巩固知识与技能。

「虎卷er · 春榜试题」具体分布如下 ——

「本季必追国际影响力AI工作」：共 18 题

活动期间，关注「机器之心 SOTA模型」服务号，即可通过底部菜单栏进入活动。

跟随入口引导，使用阿里云账号登录后即可进入活动界面开始答题。

「春卷er」前四十道题现已解锁！



今年 2 月份在 GitHub 上名为 Real-CUGAN 的图像超分辨率的项目热度很高，可以把动画图像的质量提升 2 到 4 倍，该项目是来自以下哪个机构的实验室？



2022 年 Q1 季度中，哪个机构开发的神经定理证明器成功解出了两道国际奥数题？

能够预测蛋白质的功能和作用，让主流数据库 Pfam 中注释的蛋白质序列增加了近 10%，并预测了 360 种人类蛋白质功能的是以下哪种技术？

2022 年 2 月，来自 Google AI 和 Waymo 的研究人员提出了一种神经辐射场的变体 Block-NeRF，请问他们用 280 万张街景图片重建了哪个城市？

谷歌发布的接近人类水平的对话 AI 模型 LaMDA 的参数量是多少？

2022 年 1 月，Meta AI 提出了一种名为 data2vec 的适用于多模态的学习框架，请问该框架是为了以下哪种学习方式打造的？

2022 年初，英伟达使用一种多分辨率哈希编码技术训练 NeRF，最快只需多长时间？




中国科学院自动化研究所




自 2010 年以来，ImageNet 被用于 ImageNet 大规模视觉识别挑战赛（ILSVRC），该数据集可以属于哪个模态？

CIFAR-10 数据集是 Tiny Images 数据集的一个子集，由 60000 张彩色图像组成，其中这些图像的大小是？

MNIST 数据库是一个大型的手写数字集合，其中包含的训练集和测试集比例是多少？



WikiSQL 数据集属于下面哪个模态？





UCF101 数据集中视频片段类别可以分为 5 种类型，其中不包括下面哪个类型？





CLUE 团队发布应用在 NLP 领域的数据为中心的基准 DataCLUE，是在什么思想下实践的？
英文 NLP 任务在以数据为中心的思想下的实践	中文 NLP 任务在以数据为中心的思想下的实践	英文 NLP 任务在以模型为中心的思想下的实践	中文 NLP 任务在以模型为中心的思想下的实践
中科院智能交互团队获 ACM Multimedia 2021 多模态情感识别挑战赛三项冠军，其中哪项任务没有获得冠军？

巴黎高科路桥学校等组成的团队斩获 ICCV2021 的 UVO（Unidentified Video Objects） Challenge 双赛道冠军，其中在基于图片的开放世界实例分割这个赛道中，训练所用的数据集是？



在 ICCV 2021 挑战赛中，深兰科技 DeepBlueAI 团队共参加 2 项比赛 4 个赛道，分别在三个赛道中获得冠军，其中不包括哪个赛道？





具有线性复杂度 (O(N)) 且在长序列任务中速度和显存方面显著优于 Transformer 的计算模型 PoNet 是由下面哪个机构提出的？

2022 年 1 月浙大和阿里巴巴达摩院联合提出一个多尺度自适应图神经网络（MAGNN）在四个真实世界的数据集实验中取得 SOTA 表现，请问是哪四类数据集？
太阳能、交通、电力、汇率	太阳能、交通、风力、汇率	太阳能、交通、电力、股市	风力、交通、电力、股市
2022 年 1 月，阿里巴巴达摩院提出了一个基于核的神经网络 DURation，该技术主要应用于什么问题？

用于对中文语音进行语音的命名实体识别任务的数据集 AISEHLL-NER 是以下哪个机构发布的？

阿里巴巴达摩院推出十万亿参数超大规模通用性人工智能大模型 M6-10T，该模型使用 512 GPU 在多少天内即训练出具有可用水平的 10 万亿模型？

深度语言模型体系 AliceMind 由阿里巴巴达摩院历经三年打造，并于 21 年 6 月开源。请问以下哪一个模型不属于该体系？

MUGE（Multimodal Understanding and Generation Evaluation）是业界首个大规模中文多模态评测基准，由阿里巴巴达摩院联合浙江大学、天池平台联合发布。请问以下哪个任务不属于该基准？





中国人工智能学会举办的首届全球人工智能技术创新大赛，是基于哪个竞赛平台举办的？

}

绿色游网