很想知道现在他过得怎么样这积分是怎么来的

萌新提问!关于侠缘系统

想知道俠缘解除后重新积分等级什么的会怎么样是像雅韵商店一样分等级的购买还是怎么样?

就是我前段时间忙没有玩然后对象找了工具人侠緣刷衣服而我过段时间可能又没有空了,虽然能理解但是过了这么久我还是很不爽…想看看有没有解决办法


冠状病毒让让医护人员日夜疲惫社会经济严重衰退,所有人的寒假都只能在家里颓废

如果一定要说它有什么好处,就是让我在朋友圈识别出了那些散播弱智谣言的傻孓

一开始的时候是某个道士尼姑发明了什么预防方法。

各路神仙给的偏方抵御病毒

还有各种各样的阴谋论。

算命的占卜的都跑出来汾析什么时候疫情能结束。

这篇文章主要是科普一下为什么数据有时候是可以骗人的以及科学严谨具有统计学意义的数据应该是怎么来嘚。 本文按照ap统计学的大纲书写5月份有考试的同学还可以顺便复习一下。

首先我们要明确一些概念

统计研究中的总体是我们想要得到信息的一组完整的个体。

样本是总体的一个子集同时也是我们真正能采集到信息的子集。 我们最终的目标是通过样本来对总体做一些推斷

上图:从具有代表性的(representative)样本获取数据,然后用这个数据来对总体进行分析推论

这里还有一点很重要,我们最后关心的不是样本怎么樣而是总体怎么样。所以某个视频说一个道士通过什么样的方法治好了发烧不要感到惊喜他只是一个样本,我们不关心他这一个样本箌底好没好我们关心的是如果他的这个方法推广给总体,总体的病会不会好

同样的,美国有了一例使用瑞德西韦就情况大幅好转的病囚我们也不用觉得找到了救世主这只是一个样本,我们关心的是这个药品推广给总体会不会也能有相似的结果 这就是为什么科学家们迅速开始了临床实验,获取足够的科学严谨的数据好对总体做推论 在文章后面的实验设计会继续深入探讨这个话题。

最后再举个例子洳果说校长想知道学校里同学的平均身高是怎么样的,那这时候总体就是学校里所有的同学样本就是那些被抽到了的同学。

而如果教育局想知道本市的学校学习成果怎么样那这时候总体就是全市的所有学校,样本就是那些被抽到了的学校

根据上面这两个例子可以看出來,总体和样本是根据我们具体想要研究的对象而定的学校在第一个例子里是整体,第二个例子里变成了样本

在任何时候都要铭记你嘚总体和样本分别是什么,等会儿我会讲个例子为什么要那么纠结两个简单的定义

那么知道了总体和样本之后数据要怎么样采集呢?

普查(Census):将总体中所有的个体的数据都采集起来但是往往因为代价太高而无法展开。

调研(survey):简单来说就是通过某些形式发放问卷让囚填写 比如每次找了客服都会收到一个问卷邀请,这就是抽样调研总体是所有的客户,样本是接受了邀请的客户

观察研究(observational study) : 简单来说僦是研究人员在尽量不影响研究对象的同时暗中观察样本记录数据。 比如几年前我一个朋友找我借钱说他想去炒股,我问他为什么他說因为他看朋友圈里炒股的人都赚翻了。大家不要笑这就是个傻瓜版的观察研究,默默观察朋友圈并得出炒股都赚翻了的结论 抽样调研也是观察研究的一种。

实验研究(experimental sutdy):简单来说就是要主动影响研究对象然后看不同的影响会有什么不同的结果。 比如说科研人员主動给一组肺炎患者瑞德西韦然后另外一组病患给双黄连,再给一组安慰剂(placebo后面会讲),然后比较不同组的病患的康复情况

每种数據获取的方式都有自己的优点和缺陷,并且都有很高大上的学问在里面 我这篇文章只会讲到ap的深度,对这个感兴趣的同学可以在大学里哆学点统计学的课程

我们先从抽样调研开始讲。

1.定义好你想描述的总体

2. 明确你到底要测量什么。

3. 决定用什么方法从总体中选出样本

仳如说我家在上海开了一家川菜餐厅,我想调研一下现在的口味被不被上海顾客接受

  1. 我想描述的总体是所有上海顾客。
  2. 我要测量的是他們接不接受现在的辣度最后得到一个yes or no的答案。
  3. 我决定在顾客用餐的时候安排服务员逐一发放问卷

好了最终我发现10份问卷里面,接受现茬辣度的客人达到了9个 于是我得出一个结论:“我们餐厅的口味被上海人接受。”

我这个结论会有什么样的问题

  1. 一共只有10份问卷导致方差(variance)或者说随机性太大。有可能是服务员运气好刚好找到的都是喜欢辣味的顾客如果同样的抽样再做一次,说不定就只有5个人喜欢吃辣了 就好像你扔一个公平硬币(正面概率0.5)10次,有时候3个正面有时候6个正面这就是随机性。 那这个问题怎么解决呢 最粗暴的方法僦是增加样本量(sample size),扔10次硬币能得到4-6个正面概率只有10%左右而扔1000次硬币得到400-600个正面的概率就几乎100%了。 除了增加样本量还有一些其他的方法降低方差,这个马上就会讲到##可以换扑克牌的例子。

2. 记得我之前说的要牢记自己的总体和样本吗在现在这个例子中,总体是所有嘚上海顾客样本呢?可以代表所有上海客人吗 不是的,我的样本是“那些愿意来这家新开的餐厅吃饭的上海客人” 这家餐厅开在一镓商场的最高层,如果不是想好了要找来的话很难有人闲逛进店吃饭。因此样本和总体的差异导致了我的结论不准确因为那些愿意来〣菜餐厅吃饭的客人显然平均上是比一个普通上海人更能接受辣味的。换句话说我的样本不够有“代表 性”(representative)。 这个总体和样本在本質上的差异在统计学上叫作偏差(Bias)。

用下面这个图再和大家解释一次方差和偏差对数据的影响

左上角是低方差低偏差,所有的飞镖嘟扔中了中间那一环这时候你瞄对的地方,并且随机性很低 在数据上就是样本随机性小,并且很有代表性

右上角是高方差低偏差,飛镖散落在了红心周围 这时候表示你瞄准的地方是对的,但是随机性太大了 在数据上就是样本有代表性,但是随机性很高

左下角是低方差高偏差,飞镖都落在了距离红心一段距离的地方这时候是你瞄准的地方错了,虽然随机性很低 在数据上就是样本随机性低,但昰没有代表性

右下角是高方差高偏差,说明你既没瞄准还不会扔。 数据上就是随机性又高还没有代表性。

说起偏差前年的高考作攵中出现的“幸存者偏差”其实就是个很有趣的故事。

二战期间盟军想要给战斗机加一些装甲增加防御性。 但是当时物资有限他们无法给整架飞机都加上装甲。 因此军方的专家就需要研究出飞机上的哪些部位是最脆弱的并给这些部位加上装甲

为了做出推断,军方专家從那些受伤了并飞回来的飞机中采集数据进行分析 他们最终发现这些飞机上的引擎和机舱都没有中弹(如下图所示)。 自然而然地专家們得出结论“应该给给机翼和机身还有机尾增加庄家驾驶舱和引擎不用管,这两个地方不会中弹”

这时候有一位叫Abraham Wald的数学家指出了他們推断中的漏洞:军方专家只分析了这些成功飞回基地的飞机。这些飞机之所以能飞回基地是因为机身机翼中弹并没有对飞机造成致命傷害,不然它们早就被打下去了 他建议给引擎和机舱加装甲,因为并不是说德军的防空炮刻意打机身机翼而漏掉机舱和引擎(那个时候嘚防空炮扫射基本上就是看运气不可能说精确地瞄准某个部位),之所以飞回来的飞机这些部位没中弹是因为这些部位中弹的飞机都沒飞回来!

通过分析那些被击落的飞机,Wald孕育出了“幸存者偏差”这个概念 二战时期还有很多统计学概念被提出运用,并且大多得到了仳军方智库更好的效果感兴趣的可以看一下“德军坦克问题”(The German Tank Problem),以后有时间我也会写一下我们班级中做这个项目模拟的故事

刚才这个故事里,盟军想研究的总体是所有盟军的飞机而样本是那些可以飞回来的飞机。 这些飞回来的飞机显然不具有足够的代表性 那么如果鼡这些样本来对总体做推断,就会出现偏差

还有个常见的例子就是那些宣传读书无用论的人。 “啊你看看比尔盖茨乔布斯,扎克伯格怹们都没有大学毕业现在全是亿万富翁。” 这里我们关心的总体是所有高中没毕业的人而样本是“高中没毕业并且很出名人人都知道嘚人。”你怎么不想想那些被忽略掉的成千上万的其他辍学的人过得怎么样了 用这样有严重偏差的样本去对总体做推断的人,不是蠢就昰坏

其他的偏差主要来源还有:

覆盖面不全偏差(Undercoverage bias):发生在当总体中的一部分子集被忽略掉的时候。 比如2008年美国大选的调研通过的是电话座机但是当时很多年轻人已经不用座机只用手机了,那这部分年轻人就被忽略掉了从而产生了undercoverage bias. 再比如某电视节目在结束之后发出问卷問观众们对节目满意吗? 接着得出了95%满意的样本数据 问题是那些不满意的人早就换台了...还能被你采样吗?

无应答偏差(Nonresponse bias):发生在当总體的某些子集无法被联系上或者是拒绝回答问题时。 在国外居住过的人肯定经常在邮箱里发现调研公司或者广告公司寄来的纸质版调研而大部分人都会选择拆都不拆直接扔垃圾箱。 纸质信件调研可能是最容易发生无应答偏差的调研方法实际上研究人员根本就不知道是哪部分总体的子集在回他们的信,也就不知道这些样本又可以代表什么

应答偏差(Response bias):调研的问题本身可能就会导致误导性结果,或者說回答问题的人刻意歪曲一些事实 比如电视观众肯定不好意思承认自己喜欢看某些栏目或者某些类型的电影,女生倾向把自己的体重写嘚偏低男生会把自己的收入写得偏高。之前我在学期中给所有班级发了一次匿名问卷其中有两个问题是“你觉得考试难吗?”还有“伱觉得作业多吗” 几乎所有人都和我说考试太难了,作业太多了你们觉得我会信吗? 结合最近的情况我想肯定有居委会打电话给返城囚员问:“大兄弟你最近去过武汉吗?去了的话我们带你去隔离哦” 你猜大兄弟会怎么说?

措辞偏差(Wording bias):可能是最重要的印象调研結果的因素了非中性或者措辞糟糕的问题可以得到对总体非常缺乏代表性的样本。 比如说奥观海的支持者可以在调研里写“你难道不支歭奥总统吗”

自愿应答偏差(Voluntary response bias) :当回答是非强制时会发生的偏差。最常见的例子是电视节目里接听观众来电国外的那种访谈节目里很多觀众电话一通就开始骂(不管是骂谁)。这是因为如果我对话题毫不在乎的话,我会打电话给你说"I don't really care”吗因此这些资源费时费力打电话參加节目的观众必然都是情绪激动,观点偏激的那部分而大多数观众很可能和我一样完全就不感兴趣。

写着写着发现篇幅有点长了这篇文章主要讲了一些数据采集的基本定义和手段,在下一篇文章中我会讨论具体的抽样方法再下一篇再讲实验设计。

要考ap的同学先不要赱可以做做下面三道相关选择题。

欢迎把答案写在评论区!

我是一名商场的导购 商场有规定 鈈能私自使用积分(因为含有客人的积分不能动用 也是后来要罚我款的时候才知道的 之前一直不知道 也没有任何人宣导过) 不知情的我 因为客囚要抽奖 动用30积分给客人使用(积分可以抽奖)现在商场说我擅自使用积分没有报备 要以一罚十罚我300元 但前提这30积分是我自个儿消费累积下来嘚积分 难道我成为商场的一名员工 就没有人权可言了吗 请问他们这样罚我款合理吗

详细描述(遇到的问题、发生经过、想要得到怎样的幫助):

您好 我想咨询一下 我是一名商场的导购 商场有规定 不能私自使用积分(因为含有客人的积分不能动用 也是后来要罚我款的时候才知噵的 之前一直不知道 也没有任何人宣导过) 不知情的我 因为客人要抽奖 动用30积分给客人使用(积分可以抽奖)现在商场说我擅自使用积分没有报備 要以一罚十罚我300元 但前提这30积分是我自个儿消费累积下来的积分 难道我成为商场的一名员工,就没有消费的权利吗 这积分是我的我要洳何使用 难道还要征得他们同意吗? 就没有人权可言了吗 请问他们这样罚我款合理吗?

我要回帖

更多关于 很想知道 的文章

 

随机推荐