为什么数据科学家都钟情于最常见的正态分布对于深度学习和机器学习工程师们来说,正态分布是世界上所有概率模型中最重要的一个。即使你没有
为ä»ä¹æ°æ®ç§å¦å®¶é½éæ äºæ常è§çæ£æåå¸
对äºæ·±åº¦å¦ä¹ åæºå¨å¦ä¹ å·¥ç¨å¸ä»¬æ¥è¯´ï¼æ£æåå¸æ¯ä¸çä¸æææ¦ç模åä¸æéè¦çä¸ä¸ªãå³ä½¿ä½ 没æåä¸è¿ä»»ä½äººå·¥æºè½é¡¹ç®ï¼ä¹ä¸å®éå°è¿é«æ¯æ¨¡åï¼ä»å¤©å°±è®©æ们æ¥ççé«æ¯è¿ç¨ä¸ºä»ä¹è¿ä¹å欢è¿ã
é«æ¯åå¸ï¼Gaussian distributionï¼ï¼ä¹ç§°æ£æåå¸ï¼ææ©ç±A.棣è«å¼å¨æ±äºé¡¹åå¸çæ¸è¿å ¬å¼ä¸å¾å°ãC.F.é«æ¯å¨ç 究æµé误差æ¶ä»å¦ä¸ä¸ªè§åº¦å¯¼åºäºå®ãP.S.ææ®ææ¯åé«æ¯ç 究äºå®çæ§è´¨ãæ¯ä¸ä¸ªå¨æ°å¦ãç©çåå·¥ç¨çé¢åé½é常éè¦çæ¦çåå¸ï¼å¨ç»è®¡å¦ç许å¤æ¹é¢æçé大çå½±ååã
æ£ææ²çº¿åéåï¼ä¸¤å¤´ä½ï¼ä¸é´é«ï¼å·¦å³å¯¹ç§°å å ¶æ²çº¿åéå½¢ï¼å æ¤äººä»¬åç»å¸¸ç§°ä¹ä¸ºéå½¢æ²çº¿ã
è¥éæºåéXæä»ä¸ä¸ªæ°å¦ææ为μãæ¹å·®ä¸ºÏ^2çæ£æåå¸ï¼è®°ä¸ºN(μï¼Ï^2)ãå ¶æ¦çå¯åº¦å½æ°ä¸ºæ£æåå¸çææå¼Î¼å³å®äºå ¶ä½ç½®ï¼å ¶æ åå·®Ïå³å®äºåå¸çå¹ åº¦ãå½Î¼ = 0,Ï = 1æ¶çæ£æåå¸æ¯æ åæ£æåå¸ã
é«æ¯æ¦çåå¸çæ°å¦è¡¨è¾¾å¼
å¨èªç¶ç°è±¡ä¸éå¤å¯è§
ããææ模åé½æ¯éçï¼ä½æäºæ¯æç¨ç
ããâGeorge Box
æ£å¨æ©æ£çç²åçä½ç½®å¯ä»¥ç¨æ£æåå¸æ¥æè¿°
æ£æåå¸ææå ¶å¹¿æ³çå®é èæ¯ï¼ç产ä¸ç§å¦å®éªä¸å¾å¤éæºåéçæ¦çåå¸é½å¯ä»¥è¿ä¼¼å°ç¨æ£æåå¸æ¥æè¿°ãä¾å¦ï¼å¨ç产æ¡ä»¶ä¸åçæ åµä¸ï¼äº§åç强åãæå强度ãå£å¾ãé¿åº¦çææ ï¼åä¸ç§çç©ä½ç身é¿ãä½éçææ ï¼åä¸ç§ç§åçééï¼æµéåä¸ç©ä½ç误差ï¼å¼¹çç¹æ²¿æä¸æ¹åçåå·®ï¼æ个å°åºçå¹´éæ°´éï¼ä»¥åçæ³æ°ä½ååçé度åéï¼ççã
ä¸è¬æ¥è¯´ï¼å¦æä¸ä¸ªéæ¯ç±è®¸å¤å¾®å°çç¬ç«éæºå ç´ å½±åçç»æï¼é£ä¹å°±å¯ä»¥è®¤ä¸ºè¿ä¸ªéå ·ææ£æåå¸ãä»ç论ä¸çï¼æ£æåå¸å ·æå¾å¤è¯å¥½çæ§è´¨ï¼è®¸å¤æ¦çåå¸å¯ä»¥ç¨å®æ¥è¿ä¼¼ï¼è¿æä¸äºå¸¸ç¨çæ¦çåå¸æ¯ç±å®ç´æ¥å¯¼åºçï¼ä¾å¦å¯¹æ°æ£æåå¸ãtåå¸ãFåå¸çã
æ°å¦åå ï¼ä¸å¿æéå®ç
äºç»´ç©ºé´ä¸è¿è¡200ä¸æ¥çéæºæ¸¸èµ°ä¹åå¾å°çå¾æ¡
ä¸å¿æéå®ççå 容为ï¼å¤§éç¬ç«éæºåéçåç»è¿éå½æ ååä¹åè¶è¿äºæ£æåå¸ï¼ä¸è¿äºåéåæ¬çåå¸æ å ³ãæ¯å¦ï¼éæºæ¸¸èµ°çæ»è·ç¦»å°±è¶è¿äºæ£æåå¸ãä¸é¢æ们ä»ç»ä¸ç§å½¢å¼çä¸å¿æéå®çï¼
ç¬ç«ååå¸çä¸å¿æéå®ç
设éæºåéX1ï¼X2ï¼......Xnï¼......ç¬ç«ååå¸ï¼å¹¶ä¸å ·ææéçæ°å¦ææåæ¹å·®ï¼E(Xi)=μï¼D(Xi)=Ï^2 (i=1,2....)ï¼å对任æxï¼åå¸å½æ°ä¸º
满足
该å®ç说æï¼å½nå¾å¤§æ¶ï¼éæºåé
è¿ä¼¼å°æä»æ åæ£æåå¸N(0ï¼1)ãå æ¤ï¼å½nå¾å¤§æ¶ï¼
è¿ä¼¼å°æä»æ£æåå¸N(nμï¼nÏ^2)ï¼è¯¥å®çæ¯ä¸å¿æéå®çæç®ååæ常ç¨çä¸ç§å½¢å¼ï¼å¨å®é å·¥ä½ä¸ï¼åªè¦n足å¤å¤§ï¼ä¾¿å¯ä»¥æç¬ç«ååå¸çéæºåéä¹åå½ä½æ£æåéãè¿ç§æ¹æ³å¨æ°çç»è®¡ä¸ç¨å¾å¾æ®éï¼å½å¤çå¤§æ ·æ¬æ¶ï¼å®æ¯éè¦å·¥å ·ã
棣è«ä½ï¼ææ®ææ¯å®ç
设éæºåéX(n=1,2,...,)æä»åæ°ä¸ºnï¼p(0<p<1)çäºé¡¹åå¸ï¼å对äºä»»ææéåºé´(aï¼b)æ
该å®ç表æï¼æ£æåå¸æ¯äºé¡¹åå¸çæéåå¸ï¼å½æ°å å大æ¶ï¼æ们å¯ä»¥å©ç¨ä¸å¼æ¥è®¡ç®äºé¡¹åå¸çæ¦çã
ä¸ååå¸çä¸å¿æéå®ç
设éæºåéX1ï¼X2ï¼......Xnï¼......ç¬ç«ååå¸ï¼å®ä»¬çæ¦çå¯åº¦åå«ä¸ºfxk(x)ï¼å¹¶æE(Xk)=μkï¼D(Xk)= Ïk^2ï¼ï¼k=1,2......ï¼
è¥å¯¹ä»»ææ£æ°Ïï¼æï¼
对任æxï¼éæºåéYnçåå¸å½æ°Fn(x)ï¼æ»¡è¶³ï¼
该å®ç说æï¼æç 究çéæºåéå¦ææ¯æ大éç¬ç«çèä¸ååçéæºåéç¸å èæï¼é£ä¹å®çåå¸å°è¿ä¼¼äºæ£æåå¸ã
ä¸åä¸ç¦»å ¶å®
ä¸å ¶ä»å¾å¤åå¸ä¸åï¼æ£æåå¸è¿è¡éå½çåæ¢ä¹åï¼ä»æ¯æ£æåå¸ã
两个æ£æåå¸ä¹ç§¯ä»æ¯æ£æåå¸
两个ç¬ç«çæä»æ£æåå¸çéæºåéä¹åæä»æ£æåå¸
对ä¸ä¸ªæ£æåå¸è¿è¡é«æ¯å·ç§¯è¿æ¯æ£æåå¸
æ£æåå¸ç»è¿å ç«å¶åæ¢ä¹åä»æ¯æ£æåå¸
ç®æ´
奥å¡å§åå强è°ä¸ä¸ªå²å¦ååï¼å¨å ¶ä»æ¡ä»¶é½ç¸åä¸ï¼æç®åç解就æ¯æ好ç解ã
对äºä»»ä½ä¸ä¸ªç¨æ£æåå¸æåçéæºåå¸ï¼é½å¯è½åå¨ä¸ä¸ªå¤åæ°ï¼æ´å¤æï¼æ´åç¡®ç解æ³ãä½æ¯æ们ä»ç¶ä¼å¾åäºéç¨æ£æåå¸ï¼å 为å®å¨æ°å¦ä¸å¾ç®æ´ã
å®çåå¼ï¼meanï¼ãä¸å¼ï¼medianï¼åä¼æ°ï¼modeï¼é½ç¸å
åªéè¦ç¨ä¸¤ä¸ªåæ°å°±å¯ä»¥ç¡®å®æ´ä¸ªåå¸
å¾å½¢ç¹æ§ï¼
éä¸æ§ï¼æ£ææ²çº¿çé«å³°ä½äºæ£ä¸å¤®ï¼å³åæ°æå¨çä½ç½®ã
对称æ§ï¼æ£ææ²çº¿ä»¥åæ°ä¸ºä¸å¿ï¼å·¦å³å¯¹ç§°ï¼æ²çº¿ä¸¤ç«¯æ°¸è¿ä¸ä¸æ¨ªè½´ç¸äº¤ã
åååå¨æ§ï¼æ£ææ²çº¿ç±åæ°æå¨å¤å¼å§ï¼åå«åå·¦å³ä¸¤ä¾§éæ¸ååä¸éã
ããæ²çº¿ä¸æ¨ªè½´é´çé¢ç§¯æ»çäº1ï¼ç¸å½äºæ¦çå¯åº¦å½æ°çå½æ°ä»æ£æ ç©·å°è´æ 穷积åçæ¦ç为1ãå³é¢ççæ»å为100%ã