<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
  <channel>
    <title>2030 BigDATA</title>
    <link>https://2030bigdata.tistory.com/</link>
    <description></description>
    <language>ko</language>
    <pubDate>Mon, 15 Jun 2026 09:26:26 +0900</pubDate>
    <generator>TISTORY</generator>
    <ttl>100</ttl>
    <managingEditor>IT개미 데이터</managingEditor>
    <item>
      <title>[개미의 걸음 SQL 10차시] 데이터 입력과 삭제 : INSERT, DELETE문</title>
      <link>https://2030bigdata.tistory.com/130</link>
      <description>&lt;h2 data-ke-size=&quot;size26&quot;&gt;데이터 입력[INSERT]&lt;/h2&gt;
&lt;pre id=&quot;code_1595337319710&quot; class=&quot;sql&quot; data-ke-type=&quot;codeblock&quot; data-ke-language=&quot;sql&quot;&gt;&lt;code&gt;INSERT INTO 테이블 명(컬럼1, 컬럼2, 컬럼3, ...)
VALUES (값1, 값2, 값3, ...);&lt;/code&gt;&lt;/pre&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;데이터가 들어갈 테이블, 컬럼, 데이터를 입력&lt;/li&gt;
&lt;li&gt;컬럼을 명시한 순서와 값의 순서가 같아야하고 데이터형도 일치해야만&amp;nbsp;INSERT문이 실행됨!&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;</description>
      <category>데이터베이스</category>
      <author>IT개미 데이터</author>
      <guid isPermaLink="true">https://2030bigdata.tistory.com/130</guid>
      <comments>https://2030bigdata.tistory.com/130#entry130comment</comments>
      <pubDate>Fri, 26 Mar 2021 15:00:40 +0900</pubDate>
    </item>
    <item>
      <title>[개미의 걸음 ADsP 3과목] 통계분석의 이해</title>
      <link>https://2030bigdata.tistory.com/248</link>
      <description>&lt;h2 data-ke-size=&quot;size26&quot;&gt;통계&lt;/h2&gt;
&lt;p data-ke-size=&quot;size18&quot;&gt;특정집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 의해 요약된 형태의 표현&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li data-ke-size=&quot;size18&quot;&gt;조사 대상의 범위에 따라 전수조사와 표본조사로 구분&lt;/li&gt;
&lt;/ul&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 14.41%; text-align: center;&quot;&gt;&lt;b&gt;전수 조사&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 85.56%;&quot;&gt;대상 집단 모두를 조사하는데 많은 비용*시간이 소요되므로 특별한 경우를 제외하고는 사용되지 않음&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 14.41%; text-align: center;&quot;&gt;&lt;b&gt;표본 조사&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 85.56%;&quot;&gt;모집단에서 샘플을 추출하여 진행하는 조사로 대부분의&amp;nbsp;설문조사가&amp;nbsp;표본조사로&amp;nbsp;진행됨&lt;br /&gt;모집단의 정의, 표본의 크기, 조사방법, 조사기간, 표본추출방법을 정확히 명시해야 한다.&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;# 표본 조사에서 사용되는 주요 용어&lt;/b&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;모집단[Population]&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;조사하고자 하는 대상 집단 전체&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;원소[Element]&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;모집단을 구성하는 개체&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;표본[Sample]&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;조사하기 위해 추출한 모집단의 일부 원소&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;모수[Parameter]&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;표본 관측에 의해 구하고자 하는 모집단에 대한 정보&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;표본 추출 방법&lt;/h4&gt;
&lt;p data-ke-size=&quot;size18&quot;&gt;표본조사는 모집단을 대표하는 일부만을 가지고 조사하므로 표본추출 방법에 따라 분석결과의 해석은 큰 차이가 발생&lt;/p&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 26.58%; text-align: center;&quot;&gt;&lt;b&gt;단순랜덤 추출법&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Simple Random Sampling]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 73.35%;&quot;&gt;각 샘플에 번호를 부여해 임의의 n개를 추출하는 방법&lt;br /&gt;크기가 n인 모든 가능한 표본에 동일한 산출 기회를 부여[각 샘플은 선택될 확률이 동일]&lt;br /&gt;비복원 추출, 복원 추출&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 26.58%; text-align: center;&quot;&gt;&lt;b&gt;계통추출법&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Systematic Sampling]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 73.35%;&quot;&gt;단순랜덤추출법을 변형한 방식&lt;br /&gt;번호를 부여한 샘플(N개)을 나열해 K개씩 n개의 구간(K=N/n)으로 나누고 첫 구간에서 하나를 의의 선택해 K개씩 띄어서 n개의 표본을 선택&lt;br /&gt;각 구간별로 동일한 위치의&amp;nbsp;항목을 추출하는 방법&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 26.58%; text-align: center;&quot;&gt;&lt;b&gt;집락추출법&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Cluster Random Sampling]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 73.35%;&quot;&gt;모집단을 임의의 군집으로 나눈 뒤 군집별로 단순랜덤 추출법을 수행&lt;br /&gt;집락내는 이질적, 군집간은 동질적&lt;br /&gt;모든 자료를 활용하거나 샘플링하는 방법&lt;br /&gt;지역표본추출, 다단계표본추출&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 26.58%; text-align: center;&quot;&gt;&lt;b&gt;층화추출법&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Stratified Random Sampling]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 73.35%;&quot;&gt;모집단에서 각 계층을 고루 대표할 수 있는 표본을 추출하는 방법&lt;br /&gt;층내는 동질적, 층간은 이질적&lt;br /&gt;유사한 원소끼리 몇 개의 층[Stratum]으로 나누어 각 층에서 랜덤 추출하는 방법&lt;br /&gt;비례층화추출법, 불비례층화추출법&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;측정&lt;/h4&gt;
&lt;p data-ke-size=&quot;size18&quot;&gt;&amp;nbsp;표본조사나 실험을 실시하는 과정에서 추출된 원소들이나 실험 단위로부터 주어진 목적에 적합하도록 관측해 자료를 얻는 것&lt;/p&gt;
&lt;blockquote data-ke-style=&quot;style2&quot; data-ke-size=&quot;size18&quot;&gt;※ 실험 : 특정 목적 하에서 실험 대상에게 처리를 가한 후에 그 결과를 관측해 자료를 수집하는 방법&lt;/blockquote&gt;
&lt;p data-ke-size=&quot;size18&quot;&gt;&lt;b&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 측정방법&lt;/b&gt;&lt;/p&gt;
&lt;table style=&quot;width: 100%; height: 152px; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr style=&quot;height: 38px;&quot;&gt;
&lt;td style=&quot;width: 10.56%; height: 38px; text-align: center;&quot;&gt;&lt;b&gt;명목척도&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 65.55%; height: 38px;&quot;&gt;측정 대상이 &lt;b&gt;&lt;span style=&quot;color: #ee2323;&quot;&gt;어느 집단에 속하는지 분류&lt;/span&gt;&lt;/b&gt;할 때 사용&lt;br /&gt;성별, 출생지 구분 등&lt;/td&gt;
&lt;td style=&quot;width: 23.58%; height: 76px;&quot; rowspan=&quot;2&quot;&gt;질적 척도, 범주형 자료&lt;br /&gt;[숫자들의 크기 차이가 계산되지 않는 척도]&lt;/td&gt;
&lt;/tr&gt;
&lt;tr style=&quot;height: 38px;&quot;&gt;
&lt;td style=&quot;width: 10.56%; height: 38px; text-align: center;&quot;&gt;&lt;b&gt;순서척도&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 65.55%; height: 38px;&quot;&gt;측정 대상의 &lt;b&gt;&lt;span style=&quot;color: #ee2323;&quot;&gt;서열관계&lt;/span&gt;&lt;/b&gt;를 관측하는 척도&lt;br /&gt;만족도, 선호도, 학년, 신용등급 등&lt;/td&gt;
&lt;/tr&gt;
&lt;tr style=&quot;height: 38px;&quot;&gt;
&lt;td style=&quot;width: 10.56%; height: 38px; text-align: center;&quot;&gt;&lt;b&gt;구간척도&lt;/b&gt;&lt;br /&gt;&lt;b&gt;(등간척도)&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 65.55%; height: 38px;&quot;&gt;측정 대상이 갖고 있는 &lt;span style=&quot;color: #ee2323;&quot;&gt;&lt;b&gt;속성의 양을 측정&lt;/b&gt;&lt;/span&gt;하는 것&lt;br /&gt;구간이나 구간 사이의 간격이 의미 있는 자료[두 관측값 사이 비율은 별 의미없음]&lt;/td&gt;
&lt;td style=&quot;width: 23.58%; height: 76px;&quot; rowspan=&quot;2&quot;&gt;양적 척도, 수치형 자료&lt;br /&gt;[숫자들의 크기 차이를 계산 할 수 있는 척도]&lt;/td&gt;
&lt;/tr&gt;
&lt;tr style=&quot;height: 38px;&quot;&gt;
&lt;td style=&quot;width: 10.56%; height: 38px; text-align: center;&quot;&gt;&lt;b&gt;비율척도&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 65.55%; height: 38px;&quot;&gt;간격[차이]에 대한 &lt;b&gt;&lt;span style=&quot;color: #ee2323;&quot;&gt;비율이 의미를 가지는 자료&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;절대적 기준인 0이 존재하고 사칙연산이 가능하며 제일 많은 정보를 가지는 척도&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;순서척도는 명목척도와 달리 매겨진 숫자의 크기를 의미있게 활용 가능&lt;/li&gt;
&lt;li&gt;구간척도는 절대적 크기를 측정할 수 없기 때문에 사칙연산 중 더하기*빼기는 가능하지만 비율처럼 곱하기*나누기는 안됨&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;불편 추정량 &amp;amp; 일치 추정량&lt;/h4&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 14.3%; text-align: center;&quot;&gt;&lt;b&gt;불편 추정량&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 85.69%;&quot;&gt;모집단이 모수 추정에 있어서 그것의 추정량의 기댓값이 모수와 같을 때&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 14.3%; text-align: center;&quot;&gt;&lt;b&gt;일지 추정량&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 85.69%;&quot;&gt;표본 크기가 커지면 그 값이 점점 모수에 가까워 지는 것[표준편차가 감소]&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h2 data-ke-size=&quot;size26&quot;&gt;통계분석&lt;/h2&gt;
&lt;p&gt;특정한 집단이나 불확실한 현상을 대상으로 자료를 수집해 대상 집단에 대한 정보를 구하고 적절한 통계분석 방법을 이용해 의사결정하는 과정&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;span style=&quot;color: #333333;&quot;&gt;① &lt;/span&gt;기술통계[Descriptive Statistic]&lt;/h4&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;주어진 자료로부터 어떠한 판단이나 예측과 같은 주관이 섞일 수 있는 과정을 배제하여 통계집단들의 여러 특성을 수량화하여 객관적인 데이터로 나타내는 통계분석 방법론&lt;/li&gt;
&lt;li&gt;Sample에 대한 특성인 평균, 표준편차, 중위수, 최빈값, 그래프, 왜도, 첨도 등을 구하는 것&lt;/li&gt;
&lt;/ul&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;② 통계적 추론[Inference Statistics, 추측통계]&lt;/h4&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;수집된 자료를 이용해 대상 집단[모집단]에 대한 의사결정을 하는 것&lt;/li&gt;
&lt;li&gt;제한된 표본을 바탕으로 모집단에 대한 일반적인 결론을 추정하는 것[본질적으로 불확실성 수반]&lt;/li&gt;
&lt;/ul&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 13.36%; text-align: center;&quot;&gt;&lt;b&gt;모수추정&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 86.61%;&quot;&gt;표본집단으로부터 모집단의 특성인 모수[평균, 분산 등]을 분석해 모집단을 추론&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 13.36%; text-align: center;&quot;&gt;&lt;b&gt;가설검정&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 86.61%;&quot;&gt;대상집단에 대한 특정 가설을 설정한 후 그 가설이 옳은지 그린지에 대한 채택여부를 결정하는 방법론&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 13.36%; text-align: center;&quot;&gt;&lt;b&gt;예&amp;nbsp;&amp;nbsp;&amp;nbsp; 측&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 86.61%;&quot;&gt;미래의 불확실성을 해결해 효율적인 의사결정을 하기 위해 활용&lt;br /&gt;회귀분석, 시계열분석 등의 방법 사용&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;※ 추정 : 표본으로부터 모집단이 가지는 특성(모수)을 추측하는 것&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;※ 가설검정 : 자신이 가진 이론적 대안이 통계적으로 의미가 있는지를 확인하는 것&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp; &amp;nbsp; 1) 모수 추정&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;전수조사가 불가능할 때 모집단에서 표본을 추출하고&amp;nbsp;이를 근거로 확률론을 활용해 모집단의 모수들을 추론하는 것&lt;/p&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 11.27%;&quot;&gt;점추정&lt;br /&gt;[Point Estimation]&lt;/td&gt;
&lt;td style=&quot;width: 88.7%;&quot;&gt;모수가 특정한 값일 것이라고 추정하는 것&lt;br /&gt;표본의 평균, 중위수, 최빈값 등을 사용하는 것&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 11.27%;&quot;&gt;구간추정&lt;br /&gt;[Interval Estimation]&lt;/td&gt;
&lt;td style=&quot;width: 88.7%;&quot;&gt;점추정의 정확성을 보완하기 위해 모수의 참값이 포함되어 있다고 추정되는 구간을 결정하는 것&lt;br /&gt;실제 모집단의 모수가 신뢰구간에 꼭 포함되어 있는 것은 아님&lt;br /&gt;구해진 구간 안에 모수가 있을 가능성의 크기[신뢰수준, Confidence Interval]가 주어져야 한다.&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;b&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;# 점추정량의 조건&lt;/span&gt;&lt;/b&gt;&lt;/p&gt;
&lt;div data-ke-type=&quot;moreLess&quot; data-text-less=&quot;닫기&quot; data-text-more=&quot;더보기&quot;&gt;&lt;a class=&quot;btn-toggle-moreless&quot;&gt;더보기&lt;/a&gt;
&lt;div class=&quot;moreless-content&quot;&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 17.93%; text-align: center;&quot;&gt;&lt;b&gt;불편성&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Unbiasedness]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 82%;&quot;&gt;모든 가능한 표본에서 얻은 추정량의 기댓값은 모집단의 모수와 편의가 없다.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 17.93%; text-align: center;&quot;&gt;&lt;b&gt;효율성&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Efficiency]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 82%;&quot;&gt;추정량의 분산이 작을수록 좋다.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 17.93%; text-align: center;&quot;&gt;&lt;b&gt;일치성&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Consistency]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 82%;&quot;&gt;표본의 크기가 아주 커지면, 추정량이 모수와 거의 같아진다.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 17.93%; text-align: center;&quot;&gt;&lt;b&gt;충족성&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Sufficient]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 82%;&quot;&gt;추정량은 모수에 대하여 모든 정보를 제공한다.&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;# 95%신뢰수준 하에서 모평균의 신뢰구간&lt;/span&gt;&lt;/p&gt;
&lt;div data-ke-type=&quot;moreLess&quot; data-text-less=&quot;닫기&quot; data-text-more=&quot;더보기&quot;&gt;&lt;a class=&quot;btn-toggle-moreless&quot;&gt;더보기&lt;/a&gt;
&lt;div class=&quot;moreless-content&quot;&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;adsp.jpg&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/olKE1/btqQBHb3l5B/7ySmRpU2PQbe4keHKDkFtk/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/olKE1/btqQBHb3l5B/7ySmRpU2PQbe4keHKDkFtk/img.jpg&quot; data-alt=&quot;&amp;amp;amp;lt;95% 신뢰수준 하에서 모평균의 신뢰구간&amp;amp;amp;gt;&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/olKE1/btqQBHb3l5B/7ySmRpU2PQbe4keHKDkFtk/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FolKE1%2FbtqQBHb3l5B%2F7ySmRpU2PQbe4keHKDkFtk%2Fimg.jpg&quot; data-filename=&quot;adsp.jpg&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;figcaption&gt;&amp;lt;95% 신뢰수준 하에서 모평균의 신뢰구간&amp;gt;&lt;/figcaption&gt;
&lt;/figure&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp; &amp;nbsp; 2) 가설검정&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;모집단에 대한 어떤 가설을 설정한 뒤에 표본관찰을 통해 그 가설의 채택여부를 결정하는 분석방법&lt;/p&gt;
&lt;p&gt;표본관찰 또는 실험을 통해 귀무가설과 대립가설 중에서 하나를 선택하는 과정&lt;/p&gt;
&lt;p&gt;귀무가설이 옳다는 전제하에 검정통계량 값을 구한 후에 이 값이 나타날 가능성의 크기에 의해 귀무가설의 채택여부를 결정&lt;/p&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 25.73%; text-align: center;&quot;&gt;&lt;b&gt;귀무가설&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Null Hypothesis, H&lt;sub&gt;0&lt;/sub&gt;]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 74.11%;&quot;&gt;현재까지 주장되어온 것이나 변화나 차이가 없음을 설명하는 가설&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 25.73%; text-align: center;&quot;&gt;&lt;b&gt;대립가설&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Alternative Hypothesis, H&lt;sub&gt;1&lt;/sub&gt;]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 74.11%;&quot;&gt;귀무가설에 반대되는 주장을 하는 가설로 귀무가설을 기각했을 때 받아들여지는 가설&lt;br /&gt;실제 검정대상이 되는 가설은 아니다!&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 25.73%; text-align: center;&quot;&gt;&lt;b&gt;검정통계량&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Test Statistic]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 74.11%;&quot;&gt;관찰된 표본으로부터 구하는 통계량&lt;br /&gt;검정 시 가설의 진위를 판단하는 기준&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 25.73%; text-align: center;&quot;&gt;&lt;b&gt;유의수준&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Significance Level, &lt;span&gt;&amp;alpha;&lt;/span&gt;]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 74.11%;&quot;&gt;귀무가설을 기각하게 되는 확률의 크기로 '귀무가설이 옳은데도 이를 기각하는 확률의 크기'&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 25.73%; text-align: center;&quot;&gt;&lt;b&gt;유의확률&lt;br /&gt;[p-value]&lt;br /&gt;&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 74.11%;&quot;&gt;귀무가설이 맞다고 정할 때, 표본통계량보다 극단적인 결과가 실제로 관측될 확률&lt;br /&gt;p-value와 &lt;span&gt;&amp;alpha;를 비교하여 귀무가설 기각 여부를 결정[p-value&amp;lt;&lt;span&gt;&amp;alpha;이면 기각]&lt;/span&gt;&lt;/span&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 25.73%; text-align: center;&quot;&gt;&lt;b&gt;기각역&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Critical Region,C]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 74.11%;&quot;&gt;귀무가설을 기각시키는 검정통계량들의 범위[반대는 채택역(acceptance region)}&lt;br /&gt;귀무가설이 옳다는 전제 하에서 구한 검정통계량의 분포에서 확률이 유의수준 &lt;span&gt;&amp;alpha;&lt;/span&gt;인 부분&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 제1종오류 &amp;amp; 제2종오류&lt;/b&gt;&lt;/p&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 20.3%; text-align: center;&quot;&gt;&amp;nbsp;&lt;/td&gt;
&lt;td style=&quot;width: 37.73%; text-align: center;&quot;&gt;&lt;b&gt;H&lt;sub&gt;0&lt;/sub&gt;가 사실이라고 판정&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 41.93%; text-align: center;&quot;&gt;&lt;b&gt;H&lt;sub&gt;0&lt;/sub&gt;가 사실이 아니라고 판정&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 20.3%; text-align: center;&quot;&gt;&lt;b&gt;H&lt;sub&gt;0&lt;/sub&gt;가 사실임&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 37.73%; text-align: center;&quot;&gt;옳음 결정&lt;/td&gt;
&lt;td style=&quot;width: 41.93%; text-align: center;&quot;&gt;제 1종 오류[&lt;span&gt;&amp;alpha;&lt;/span&gt;]&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 20.3%; text-align: center;&quot;&gt;&lt;b&gt;&amp;nbsp;H&lt;sub&gt;0&lt;/sub&gt;가 사실이 아님&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 37.73%; text-align: center;&quot;&gt;제 2종 오류[&lt;span&gt;&amp;beta;&lt;/span&gt;]&lt;/td&gt;
&lt;td style=&quot;width: 41.93%; text-align: center;&quot;&gt;옳은 결정&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;제 1종 오류[Type 1 error] : 귀무가설 H&lt;sub&gt;0&lt;/sub&gt;가 옳은데도 귀무가설을 기각하게 되는 오류&lt;/li&gt;
&lt;li&gt;제 2종 오류[Type 2 error] : 귀무가설 H&lt;sub&gt;0&lt;/sub&gt;가 옳지 않은데도 귀무가설을 채택하게 되는 오류&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h2 data-ke-size=&quot;size26&quot;&gt;통계적&amp;nbsp;검정&lt;/h2&gt;
&lt;p&gt;통계적 검정에서 모집단의 모수에 대한 검정은 모수적 검정과 비모수적 검정으로 구분&lt;/p&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%; text-align: center;&quot;&gt;&lt;b&gt;모수적 방법&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 50%; text-align: center;&quot;&gt;&lt;b&gt;비모수적 방법&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;검정하고자 하는 모집단의 분포에 대한 가정을 하고,&lt;br /&gt;그 가정하에서 검정통계량과 검정통계량의 분포를 유도해 검정을 실시하는 방법&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;자료가 추출된 모집단의 분포에 대한 아무 제약을 가하지 않고 검정을 실시하는 방법&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;가정된 분포의 모수에 대해 가설 설정&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;가정된 분포가 없음&lt;br /&gt;[가설은 단지 '분포의 형태가 동일하다' 또는 '분포의 형태가 동일하지 않다'와 같이 분포의 형태에 대해 설정]&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;관측된 자료를 이용해 구한 표본평균, 표분분산 등을 이용해 검정을 실시&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;관측값의 절대적인 크기에 의존하지 않는 관측값들의 순위나 두 관측값 차이의 부호 등을 이용해 검정&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;비모수적 방법을 사용하는 경우&lt;/h4&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;관측된 자료가 특정분포를 따른다고 가정할 수 없는 경우에 이용&lt;/li&gt;
&lt;li&gt;관측된 자료의 수가 많지 않을 경우(30개 미만)에 사용&lt;/li&gt;
&lt;li&gt;관측된 자료가 개체간의 서열관계를 나타내는 경우에 사용&lt;/li&gt;
&lt;li&gt;즉, 표본의 크기가 작거나 순서형 자료를 포함하는 범주형 자료에 적용 가능&lt;/li&gt;
&lt;/ul&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;비모수 검정의 예&lt;/h4&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;부호검정[Sign Test]&lt;/li&gt;
&lt;li&gt;윌콕슨의 순위합검정[Rank Sum Test]&lt;/li&gt;
&lt;li&gt;윌콕슨의 부호순위합검정[Wilcoxon Signed Rank Test]&lt;/li&gt;
&lt;li&gt;만-위트니의 U검정&lt;/li&gt;
&lt;li&gt;런검정[Run Test]&lt;/li&gt;
&lt;li&gt;스피어만의 순위상관계수&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;</description>
      <category>자격증/ADsP</category>
      <category>ADsP</category>
      <category>귀무가설</category>
      <category>모수</category>
      <category>불편추정량</category>
      <category>빅데이터</category>
      <category>척도</category>
      <category>통계</category>
      <category>통계적 추론</category>
      <category>표본추출방법</category>
      <author>IT개미 데이터</author>
      <guid isPermaLink="true">https://2030bigdata.tistory.com/248</guid>
      <comments>https://2030bigdata.tistory.com/248#entry248comment</comments>
      <pubDate>Wed, 17 Feb 2021 17:17:23 +0900</pubDate>
    </item>
    <item>
      <title>[개미의 걸음 ADsP 3과목] 확률분포① 이산형 확률 분포</title>
      <link>https://2030bigdata.tistory.com/256</link>
      <description>&lt;h2 data-ke-size=&quot;size26&quot;&gt;이산형 확률 분포&lt;/h2&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&amp;nbsp; ① 이산형 확률변수&lt;/h3&gt;
&lt;p&gt;&amp;nbsp;확률변수 X가 유한집합이거나 자연수의 부분집합과 일대일 대응일 때의 확률변수 X&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&amp;nbsp;② 수학적 기대값, E[u(x)]&lt;/h3&gt;
&lt;p&gt;f(x)가 이산확률변수 x의 pdf이고 &amp;sum;u(x)f(x)의 값이 존재할 때, 이를 수학적 기대값이라 함&lt;/p&gt;
&lt;table style=&quot;border-collapse: collapse; width: 100%;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 100%;&quot;&gt;&lt;span style=&quot;color: #333333;&quot;&gt;&amp;nbsp;&lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: #333333;&quot;&gt;★&lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;기대값의 성질&lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: #333333;&quot;&gt;★&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;1. E[c]= C [단, C는 상수]&lt;br /&gt;2. E[cx] = cE(x)&lt;br /&gt;3. E[cu(x)]=cE[u(x)]&lt;br /&gt;&lt;span style=&quot;color: #333333;&quot;&gt;4. E[c&lt;sub&gt;1&lt;/sub&gt;u&lt;sub&gt;1&lt;/sub&gt;(x)&lt;span style=&quot;color: #333333;&quot;&gt;&amp;plusmn;&lt;span style=&quot;color: #333333;&quot;&gt;c&lt;sub&gt;2&lt;/sub&gt;u&lt;sub&gt;2&lt;/sub&gt;(x)&lt;/span&gt;&lt;/span&gt;]=c&lt;sub&gt;1&lt;/sub&gt;E[u&lt;sub&gt;1&lt;/sub&gt;(x)]&lt;span style=&quot;color: #333333;&quot;&gt;&amp;plusmn;&lt;/span&gt;&lt;span style=&quot;color: #333333;&quot;&gt;c&lt;sub&gt;2&lt;/sub&gt;&lt;span style=&quot;color: #333333;&quot;&gt;E[u&lt;sub&gt;2&lt;/sub&gt;(x)]&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;5. u&lt;sub&gt;1&lt;/sub&gt;(x) &amp;le;&lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: #333333;&quot;&gt;&lt;span style=&quot;color: #333333;&quot;&gt;u&lt;sub&gt;2&lt;/sub&gt;(x)이면&lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;E[u&lt;sub&gt;1&lt;/sub&gt;(x)] &amp;le;&lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: #333333;&quot;&gt;&lt;span style=&quot;color: #333333;&quot;&gt;E[u&lt;sub&gt;2&lt;/sub&gt;(x)]이다.&lt;/span&gt;&lt;/span&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&amp;nbsp; 평균과 분산&lt;/h3&gt;
&lt;p&gt;확률변수 X가 이산확률밀도 함수f(x)를 갖고 그 공간 R={b&lt;sub&gt;1&lt;/sub&gt;,b&lt;sub&gt;2&lt;/sub&gt;...}일 때, b&lt;sub&gt;1&lt;/sub&gt;f(b&lt;sub&gt;1&lt;/sub&gt;)+&lt;span style=&quot;color: #333333;&quot;&gt;b&lt;sub&gt;2&lt;/sub&gt;f(b&lt;sub&gt;2&lt;/sub&gt;)....를 평균이라고 함&lt;/span&gt;&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;&lt;span style=&quot;color: #333333;&quot;&gt;ex1&amp;gt; f(x)=1/8 (x=0,1)&amp;nbsp; ,&amp;nbsp; f(x)=3/8 (x=2,3)일때, X의 평균은?&lt;br /&gt;&amp;nbsp; &amp;nbsp;E(X) =&lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&amp;sum;xf(x)= 0*(1/8) + 1*(1/8) + 2*(3/8) + 3*(3/8) = 2&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;표준편차의 제곱을 분산이라고 함&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;분산은 '평균'으로부터 떨어진 정도를 나타냄&lt;/li&gt;
&lt;li&gt;var(x) = (표준편차)&lt;sup&gt;2 &lt;/sup&gt;= E[(x-u)&lt;sup&gt;2&lt;/sup&gt;]&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; = E[x&lt;sup&gt;2&lt;/sup&gt;-2ux+u&lt;sup&gt;2&lt;/sup&gt;]&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; = E[x&lt;sup&gt;2&lt;/sup&gt;]-2uE[x]+u&lt;sup&gt;2&lt;/sup&gt;&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; = E[x&lt;sup&gt;2&lt;/sup&gt;] - u&lt;sup&gt;2&lt;/sup&gt;&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; = E[x&lt;sup&gt;2&lt;/sup&gt;] - (E[x])&lt;sup&gt;2&lt;/sup&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;table style=&quot;border-collapse: collapse; width: 100%;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 100%;&quot;&gt;&lt;span style=&quot;color: #333333;&quot;&gt;&lt;span&gt;&amp;nbsp;&lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color: #333333;&quot;&gt;★&lt;span&gt;&amp;nbsp;분산의&lt;/span&gt;&lt;/span&gt;&amp;nbsp;성질&lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: #333333;&quot;&gt;★&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #333333;&quot;&gt;1. var(Cx) = Cvar(x)&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; [단, C는 상수]&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #333333;&quot;&gt;2. var(ax+b) = a2var(x)&amp;nbsp; &lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: #333333;&quot;&gt;[단, a,b는 상수]&lt;br /&gt;3. var(C) = 0&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &lt;span&gt;&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: #333333;&quot;&gt;&lt;span&gt;&amp;nbsp;&lt;/span&gt;&amp;nbsp; &amp;nbsp; [단, C는 상수]&lt;/span&gt;&amp;nbsp;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;b&gt;&lt;span style=&quot;color: #333333;&quot;&gt;&amp;nbsp; ※ 체비세프의 부등식&lt;/span&gt;&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;&lt;span style=&quot;color: #333333;&quot;&gt;확률변수 X가 유한인 평균과 분산을 가지면, k&amp;ge;1인 모든 k에 대해 P[|x-u|&amp;ge;k*(표준편차)]&amp;le;(1/k)&lt;sub&gt;2&lt;/sub&gt;를 만족한다.&lt;br /&gt;&lt;br /&gt;&lt;/span&gt;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&amp;nbsp;③ 확률질량함수[Probability Mass Functon, pmf]&lt;/h3&gt;
&lt;p&gt;&amp;nbsp;이산확률변수 X에 대한 확률P(X=x)&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;f(x)를 이산확률변수 X의 pmf라고 한다.&lt;/li&gt;
&lt;li&gt;f(x) &amp;gt; 0&amp;nbsp; ,&amp;nbsp; x &amp;isin; R&lt;br /&gt;&amp;nbsp; &amp;nbsp; R : X의 공간&lt;/li&gt;
&lt;li&gt;&amp;sum;f(x) = 1&lt;/li&gt;
&lt;li&gt;P(X&amp;isin;A) =&amp;nbsp;&amp;sum;f(x)&amp;nbsp; ,&amp;nbsp; A&amp;sub;R&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&amp;nbsp; &amp;nbsp;누적분포함수[Cumulative Distribution Function, cdf]&lt;/h3&gt;
&lt;p&gt;&amp;nbsp;A={t:t&amp;le;x, x&amp;isin;R}, F(x)=P(X&amp;isin;x)=&amp;sum;f(t)일 때, 확률변수 X의 누적분포함수를 F(x)라고 함&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;0 &amp;le; F(x) &amp;le;1&amp;nbsp;&lt;br /&gt;&amp;nbsp; &amp;nbsp;&amp;rarr; F(x)는 확률이므로&lt;/li&gt;
&lt;li&gt;F(x)는 x의 비감소 함수&lt;br /&gt;&amp;nbsp; x&lt;sub&gt;1&lt;/sub&gt;&amp;lt;x&lt;sub&gt;2&lt;/sub&gt;일때, F(x&lt;sub&gt;1&lt;/sub&gt;) = P(X&amp;le;x&lt;sub&gt;1&lt;/sub&gt;)&amp;nbsp;&amp;nbsp;&amp;le; P(X&amp;le;x&lt;sub&gt;2&lt;/sub&gt;&lt;span style=&quot;color: #333333;&quot;&gt;) = &lt;span&gt;F(x&lt;sub&gt;2&lt;/sub&gt;&lt;/span&gt;&lt;span&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/li&gt;
&lt;li&gt;F(&amp;infin;) = 1&lt;br /&gt;F(-&amp;infin;) = 0&lt;/li&gt;
&lt;li&gt;F는 오른편 연속 함수&amp;nbsp; &amp;nbsp;&lt;/li&gt;
&lt;li&gt;X가 이산확률변수일 때, F(x)는 계단함수[Step Function]&lt;br /&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/dTE6XO/btqTIpz33FO/hOTbZ4r3a5LUYXdzPK7q7K/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/dTE6XO/btqTIpz33FO/hOTbZ4r3a5LUYXdzPK7q7K/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/dTE6XO/btqTIpz33FO/hOTbZ4r3a5LUYXdzPK7q7K/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FdTE6XO%2FbtqTIpz33FO%2FhOTbZ4r3a5LUYXdzPK7q7K%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&amp;nbsp; 적률생성함수[Moment Generating Function, mgf], M(t)&lt;/h3&gt;
&lt;p&gt;-h &amp;lt;t &amp;lt; h 일때,&amp;nbsp; E(e&lt;sup&gt;tx&lt;/sup&gt;)=&amp;sum;e&lt;sup&gt;tx&lt;/sup&gt;f(x)를 x의 적률생성함수라고 함&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;확률변수 X의 적률은 X의 거듭제곱의 기대값을 적률(Moment)이라고 함&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;rarr; 확률변수는 pdf가 f(x)인 이산확률변수&lt;/li&gt;
&lt;li&gt;E[x&lt;sup&gt;r&lt;/sup&gt;] = &amp;sum;x&lt;sup&gt;r&lt;/sup&gt;f(x)&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;rarr; 원점에 대한 X의 r차 적률&lt;/li&gt;
&lt;li&gt;E[(x-b)&lt;sup&gt;r&lt;/sup&gt;] =&amp;nbsp;&amp;sum;(x-b)&lt;sup&gt;r&lt;/sup&gt;f(x)&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;rarr; 중심이 b인 X의 r차 적률&lt;/li&gt;
&lt;li&gt;확률변수 X의 적률생성함수가 -h &amp;lt; t &amp;lt; h에서 존재할 때, R(t) = lnM(t)를 x의 누가적률이라고 함&lt;br /&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/lUQJw/btqTLxqt1i0/UUGnPgWnhM66reqNKYlgQK/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/lUQJw/btqTLxqt1i0/UUGnPgWnhM66reqNKYlgQK/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/lUQJw/btqTLxqt1i0/UUGnPgWnhM66reqNKYlgQK/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FlUQJw%2FbtqTLxqt1i0%2FUUGnPgWnhM66reqNKYlgQK%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/li&gt;
&lt;li&gt;서로 독립인 확률변수 x&lt;sub&gt;1&lt;/sub&gt;,x&lt;sub&gt;2&lt;/sub&gt;, ... x&lt;sub&gt;n&lt;/sub&gt;의 적률생성함수가 각각 Mx&lt;sub&gt;1&lt;/sub&gt;(t)....Mx&lt;sub&gt;n&lt;/sub&gt;(t)라고 할 때, Y = a&lt;sub&gt;0&lt;/sub&gt; + a&lt;sub&gt;1&lt;/sub&gt;x&lt;sub&gt;1&lt;/sub&gt; + a&lt;sub&gt;2&lt;/sub&gt;x&lt;sub&gt;2&lt;/sub&gt; + .... + a&lt;sub&gt;n&lt;/sub&gt;x&lt;sub&gt;n&lt;/sub&gt;(단, a&lt;sub&gt;1&lt;/sub&gt;,a&lt;sub&gt;2&lt;/sub&gt;,....a&lt;sub&gt;n&lt;/sub&gt;은 상수)의 적률생성함수는 MY(t)=e&lt;sub&gt;a&lt;sub&gt;0&lt;/sub&gt;t&lt;/sub&gt;Mx&lt;sub&gt;1&lt;/sub&gt;(a&lt;sub&gt;1&lt;/sub&gt;t) X ....... X Mx&lt;sub&gt;n&lt;/sub&gt;(a&lt;sub&gt;n&lt;/sub&gt;t)&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;b&gt;적률생성함수 특징&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/Ivqf6/btqTV9veIJo/Y5CNY4w5d10ObaeuoSpmq0/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/Ivqf6/btqTV9veIJo/Y5CNY4w5d10ObaeuoSpmq0/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/Ivqf6/btqTV9veIJo/Y5CNY4w5d10ObaeuoSpmq0/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FIvqf6%2FbtqTV9veIJo%2FY5CNY4w5d10ObaeuoSpmq0%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;var(x)= E(x&lt;sup&gt;2&lt;/sup&gt;)-[E(x)]&lt;sup&gt;2&lt;/sup&gt; = M''x(0)-[M'(0)]&lt;sup&gt;2&lt;/sup&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;b&gt;&lt;span style=&quot;color: #333333;&quot;&gt;&lt;span&gt;&amp;nbsp;&lt;/span&gt;※ 맥로린 급수[Maclaurln's Series]&lt;/span&gt;&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;&lt;span style=&quot;color: #333333;&quot;&gt;Talyer's Series에서 f(x)=e&lt;sup&gt;x&lt;/sup&gt;를 대입한 것&lt;/span&gt;&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;&lt;span style=&quot;color: #333333;&quot;&gt;f(x) = f(0) + f'(0)x + f''(0)x&lt;sup&gt;2&lt;/sup&gt;/2! + ....&lt;/span&gt;&lt;/li&gt;
&lt;li&gt;&lt;span style=&quot;color: #333333;&quot;&gt;e&lt;sup&gt;x&lt;/sup&gt; = 1 + x + x&lt;sup&gt;2&lt;/sup&gt;/2! + x&lt;sup&gt;3&lt;/sup&gt;/3! + ....&lt;/span&gt;&lt;/li&gt;
&lt;li&gt;&lt;span style=&quot;color: #333333;&quot;&gt;M(t) = E(e&lt;sup&gt;tx&lt;/sup&gt;)=E(1 + xt + (xt)&lt;sup&gt;2&lt;/sup&gt;/2! +...) = E(1) + E(x)t + E(x&lt;sup&gt;2&lt;/sup&gt;)t&lt;sup&gt;2&lt;/sup&gt;/2! +....&lt;/span&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&amp;nbsp;④ 베르누이 시행과 이항 분포&lt;/h3&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;베르누이 시행[Bernoulli Trial]&lt;/h4&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;두 가지의 서로 배반적이고 완전히 분할되는 실험일 때 적용 가능&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;ex&amp;gt; 결과가 둘 중 하나(앞/뒤, 합/불, 삶/죽음 등) 일 때&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; 즉, 서로 동시에 일어날 확률이 0&lt;/li&gt;
&lt;li&gt;확률변수 X의 pdf가 f(x) = p&lt;sup&gt;x&lt;/sup&gt;(1-p)&lt;sup&gt;1-x&lt;/sup&gt;&amp;nbsp; ,&amp;nbsp; x=0,1&amp;nbsp; ,&amp;nbsp; 0&amp;le;p&amp;le;1&amp;nbsp; ,&amp;nbsp; q = 1 - p&amp;nbsp; 일때, X는 베르누이 분포를 갖는다&lt;/li&gt;
&lt;/ul&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;이항분포[Binomial Distribution]&lt;/h4&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;확률변수 x의 밀도함수가 다음과 같을 때, X는 모수가 (n,p)인 이항분포를 갖는다.&lt;br /&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/UG2bN/btqTLypqMAW/fqrGdjxx3EGIFogE38Vah1/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/UG2bN/btqTLypqMAW/fqrGdjxx3EGIFogE38Vah1/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/UG2bN/btqTLypqMAW/fqrGdjxx3EGIFogE38Vah1/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FUG2bN%2FbtqTLypqMAW%2FfqrGdjxx3EGIFogE38Vah1%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/li&gt;
&lt;li&gt;베르누이 시행의 반복 횟수를 n, 각 시행에서 성공할 확률을 p라고 할 때 다음과 같다.&lt;br /&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/bSmAO2/btqTIqeP1fD/A6OXWywDL14Vz1kd33Cimk/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/bSmAO2/btqTIqeP1fD/A6OXWywDL14Vz1kd33Cimk/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/bSmAO2/btqTIqeP1fD/A6OXWywDL14Vz1kd33Cimk/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbSmAO2%2FbtqTIqeP1fD%2FA6OXWywDL14Vz1kd33Cimk%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp; 이항분포의 성질&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/bvXDNH/btqT18X1USv/JUdtnw95qR3HmflIfGk1K1/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/bvXDNH/btqT18X1USv/JUdtnw95qR3HmflIfGk1K1/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/bvXDNH/btqT18X1USv/JUdtnw95qR3HmflIfGk1K1/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbvXDNH%2FbtqT18X1USv%2FJUdtnw95qR3HmflIfGk1K1%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&lt;b&gt;약한 대수의 법칙&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/bxWnbS/btqTV8kqIYY/aKoOSqaDcgKlppo4L3qHC1/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/bxWnbS/btqTV8kqIYY/aKoOSqaDcgKlppo4L3qHC1/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/bxWnbS/btqTV8kqIYY/aKoOSqaDcgKlppo4L3qHC1/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbxWnbS%2FbtqTV8kqIYY%2FaKoOSqaDcgKlppo4L3qHC1%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;⑤ 초기하 분포[H&lt;span&gt;ypergeometric Distribution]&lt;/span&gt;&lt;/h3&gt;
&lt;p&gt;X의 pdf인 f(x)가 다음과 같을 때 초기하 분포라고 함&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;크기가 유한인 모집단으로 부터 비복원 추출시 나타나는 확률 분포&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/LqyY5/btqTSU08kAH/lh2flMoH2lswSZ04DrGLQK/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/LqyY5/btqTSU08kAH/lh2flMoH2lswSZ04DrGLQK/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/LqyY5/btqTSU08kAH/lh2flMoH2lswSZ04DrGLQK/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FLqyY5%2FbtqTSU08kAH%2Flh2flMoH2lswSZ04DrGLQK%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/bYPmSH/btqUseSc76b/vDif0hKmHoUBuezsfyJIO0/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/bYPmSH/btqUseSc76b/vDif0hKmHoUBuezsfyJIO0/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/bYPmSH/btqUseSc76b/vDif0hKmHoUBuezsfyJIO0/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbYPmSH%2FbtqUseSc76b%2FvDif0hKmHoUBuezsfyJIO0%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/bHxmLD/btqUvC5GiXX/KJ4TJOcZsBP4x1Uh8byd1K/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/bHxmLD/btqUvC5GiXX/KJ4TJOcZsBP4x1Uh8byd1K/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/bHxmLD/btqUvC5GiXX/KJ4TJOcZsBP4x1Uh8byd1K/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbHxmLD%2FbtqUvC5GiXX%2FKJ4TJOcZsBP4x1Uh8byd1K%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/bIkBOA/btqUtqY9y4g/eKZ4Xc2cUS1PowjUELBcU1/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/bIkBOA/btqUtqY9y4g/eKZ4Xc2cUS1PowjUELBcU1/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/bIkBOA/btqUtqY9y4g/eKZ4Xc2cUS1PowjUELBcU1/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbIkBOA%2FbtqUtqY9y4g%2FeKZ4Xc2cUS1PowjUELBcU1%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;⑥ 기하 분포[Geometric Distribution]&lt;/h3&gt;
&lt;p&gt;성공 확률이 p인 베르누이 시행에서 처음 성공이 일어날 때까지 반복한 시행 횟수&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;확률변수 x의 pdf가 다음과 같이 주어질 때, x는 모수가 p인 기하분포를 가짐&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/cYGh6u/btqUpabt9LY/rOF6Ta0MKhWMJaIJA6u7ek/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/cYGh6u/btqUpabt9LY/rOF6Ta0MKhWMJaIJA6u7ek/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/cYGh6u/btqUpabt9LY/rOF6Ta0MKhWMJaIJA6u7ek/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcYGh6u%2FbtqUpabt9LY%2FrOF6Ta0MKhWMJaIJA6u7ek%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/c9MdEf/btqUBwcwaMf/mEMieD3IWdSUxz01obKQnK/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/c9MdEf/btqUBwcwaMf/mEMieD3IWdSUxz01obKQnK/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/c9MdEf/btqUBwcwaMf/mEMieD3IWdSUxz01obKQnK/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fc9MdEf%2FbtqUBwcwaMf%2FmEMieD3IWdSUxz01obKQnK%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;⑦ 음이항 분포[Negative Binominal Distribution]&lt;/h3&gt;
&lt;p&gt;성공확률이 p인 베르누이 시행에서 독립적으로 반복시행시 r번 성공할 때까지의 실패횟수&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;확률변수 x의 pdf가 다음과 같을 때, x는 모수가 r,p인 음이항 분포를 가짐&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/befWUc/btqUuMHxnNW/cxoK0U04skINlKiJFRxvF0/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/befWUc/btqUuMHxnNW/cxoK0U04skINlKiJFRxvF0/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/befWUc/btqUuMHxnNW/cxoK0U04skINlKiJFRxvF0/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbefWUc%2FbtqUuMHxnNW%2FcxoK0U04skINlKiJFRxvF0%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/bOq2H8/btqUuL9C1gi/ACNv1PTaWTiqYIYIOWZ8q1/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/bOq2H8/btqUuL9C1gi/ACNv1PTaWTiqYIYIOWZ8q1/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/bOq2H8/btqUuL9C1gi/ACNv1PTaWTiqYIYIOWZ8q1/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbOq2H8%2FbtqUuL9C1gi%2FACNv1PTaWTiqYIYIOWZ8q1%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;⑧ 포아송 분포[Poisson Distribution]&lt;/h3&gt;
&lt;p&gt;시간과 공간 내에서 발생하는 사건의 발생횟수에 대한 확률분포&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;확률변수 x의 pdf가 다음과 같을 때 x는 모수가 &amp;lambda;인 포아송 분포를 가짐&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/c2bqvR/btqUEAZ4uX8/hDKCkeSkWlluZtmBrtGpR1/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/c2bqvR/btqUEAZ4uX8/hDKCkeSkWlluZtmBrtGpR1/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/c2bqvR/btqUEAZ4uX8/hDKCkeSkWlluZtmBrtGpR1/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fc2bqvR%2FbtqUEAZ4uX8%2FhDKCkeSkWlluZtmBrtGpR1%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&lt;b&gt;포아송 분포가 되기 위한 조건&lt;/b&gt;&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;겹치지 않는 구간에서 일어나는 사건의 수는 서로 독립이다.&lt;/li&gt;
&lt;li&gt;짧은 구간에서 하나의 사건이 일어날 확률은 구간의 길이에 비례한다.&lt;/li&gt;
&lt;li&gt;충분히 짧은 구간에서 둘 이상의 사건이 일어날 확률은 0이다.&lt;/li&gt;
&lt;li&gt;전 구간을 통해 어느 부분에서나 사건은 동일하게 일어난다.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/dSONF1/btqUwxpw46l/upkNZ4OMqRLppl872jUT31/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/dSONF1/btqUwxpw46l/upkNZ4OMqRLppl872jUT31/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/dSONF1/btqUwxpw46l/upkNZ4OMqRLppl872jUT31/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FdSONF1%2FbtqUwxpw46l%2FupkNZ4OMqRLppl872jUT31%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;⑨ 다항 분포[Multinomial Distribution]&lt;/h3&gt;
&lt;p&gt;세가지 이상의 결과를 가지는 반복 시행에서 발생하는 확률분포&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;이항분포를 확장한 확률 분포&lt;/li&gt;
&lt;li&gt;확률변수 x의 pdf가 다음과 같을 때 x는 다항분포를 가짐&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/mCj0V/btqUwyBYlyc/fkZdTKZScI7q3MbVOhzHP1/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/mCj0V/btqUwyBYlyc/fkZdTKZScI7q3MbVOhzHP1/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/mCj0V/btqUwyBYlyc/fkZdTKZScI7q3MbVOhzHP1/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FmCj0V%2FbtqUwyBYlyc%2FfkZdTKZScI7q3MbVOhzHP1%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;</description>
      <category>자격증/ADsP</category>
      <author>IT개미 데이터</author>
      <guid isPermaLink="true">https://2030bigdata.tistory.com/256</guid>
      <comments>https://2030bigdata.tistory.com/256#entry256comment</comments>
      <pubDate>Mon, 15 Feb 2021 17:17:05 +0900</pubDate>
    </item>
    <item>
      <title>[개미의 걸음 ADsP 3과목] 확률의 이해</title>
      <link>https://2030bigdata.tistory.com/247</link>
      <description>&lt;h2 data-ke-size=&quot;size26&quot;&gt;확률&lt;/h2&gt;
&lt;p&gt;표본공간[S]에 있는 각 사건과 실수 P(A)가 대응하는 집합함수&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;부분집합인 각 사건에 대해 실수값을 가지는 함수의 확률 값&lt;/li&gt;
&lt;li&gt;P(A)는 A의 확률[0 &amp;le; P(A) &amp;le; 1 ,&amp;nbsp;&amp;nbsp;P(S) =1]&lt;/li&gt;
&lt;/ul&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;표본공간[Sample Space, S(간혹 Ω로 표기)&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;모든 가능한 실험 결과들의 모임&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;사건[Event]&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;표본공간[S]의 부분집합&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;원소[Element]&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;나타날 수 있는 개별의 결과들을 의미&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;확률변수[Random Variable]&lt;/td&gt;
&lt;td style=&quot;width: 50%;&quot;&gt;표본공간[S]의 각 원소 S가 단 하나의 실수 X에 대응하는 함수&lt;br /&gt;정의역이 표본공간 치역이 실수값[0&amp;lt;y&amp;lt;1]인 함수&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p data-ke-size=&quot;size18&quot;&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;# 집합의 연산법칙&lt;/b&gt;&lt;/span&gt;&lt;/p&gt;
&lt;div data-ke-type=&quot;moreLess&quot; data-text-more=&quot;더보기&quot; data-text-less=&quot;닫기&quot;&gt;&lt;a class=&quot;btn-toggle-moreless&quot;&gt;더보기&lt;/a&gt;
&lt;div class=&quot;moreless-content&quot;&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 25.86%; text-align: center;&quot;&gt;&lt;b&gt;교환 법칙&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 37.35%; text-align: center;&quot;&gt;A&amp;cup;B=B&amp;cup;A&lt;/td&gt;
&lt;td style=&quot;width: 36.75%; text-align: center;&quot;&gt;A&amp;cap;B=B&amp;cap;A&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 25.86%; text-align: center;&quot;&gt;&lt;b&gt;결합 법칙&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 37.35%; text-align: center;&quot;&gt;(A&amp;cup;B)&amp;cup;C=A&lt;span&gt;&amp;cup;&lt;/span&gt;(B&lt;span&gt;&amp;cup;&lt;/span&gt;C)&lt;/td&gt;
&lt;td style=&quot;width: 36.75%; text-align: center;&quot;&gt;(A&amp;cap;B)&amp;cap;C=A&lt;span&gt;&amp;cap;&lt;/span&gt;(B&lt;span&gt;&amp;cap;&lt;/span&gt;C)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 25.86%; text-align: center;&quot;&gt;&lt;b&gt;분배 법칙&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 37.35%; text-align: center;&quot;&gt;A&amp;cap;(B&lt;span&gt;&amp;cup;&lt;/span&gt;C)=(A&amp;cap;B)&lt;span&gt;&amp;cup;&lt;/span&gt;(A&amp;cap;C)&lt;/td&gt;
&lt;td style=&quot;width: 36.75%; text-align: center;&quot;&gt;A&lt;span&gt;&amp;cup;&lt;/span&gt;(B&lt;span&gt;&amp;cap;&lt;/span&gt;C)=(A&lt;span&gt;&amp;cup;&lt;/span&gt;B)&lt;span&gt;&amp;cap;&lt;/span&gt;(A&lt;span&gt;&amp;cup;&lt;/span&gt;C)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 25.86%; text-align: center;&quot;&gt;&lt;b&gt;드모르간[De Morgan] 법칙&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 37.35%; text-align: center;&quot;&gt;(A&lt;span&gt;&amp;cup;&lt;/span&gt;B)&lt;sup&gt;c&lt;/sup&gt;=A&lt;sup&gt;c&lt;/sup&gt;&amp;cap;B&lt;sup&gt;c&lt;/sup&gt;&lt;/td&gt;
&lt;td style=&quot;width: 36.75%; text-align: center;&quot;&gt;(A&amp;cap;B)&lt;sup&gt;c&lt;/sup&gt;=A&lt;sup&gt;c&lt;/sup&gt;&lt;span&gt;&amp;cup;&lt;/span&gt;B&lt;sup&gt;c&lt;/sup&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;확률의 성질&lt;/h4&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp; ① P(A) = 1-P(A&lt;sup&gt;c&lt;/sup&gt;)&lt;/b&gt;&lt;/p&gt;
&lt;div data-ke-type=&quot;moreLess&quot; data-text-more=&quot;더보기&quot; data-text-less=&quot;닫기&quot;&gt;&lt;a class=&quot;btn-toggle-moreless&quot;&gt;더보기&lt;/a&gt;
&lt;div class=&quot;moreless-content&quot;&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 100%;&quot;&gt;1=P(S)=P(A&amp;cup;A&lt;sup&gt;c&lt;/sup&gt;)=P(A)+P(A&lt;sup&gt;c&lt;/sup&gt;)&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;rarr;&amp;nbsp; A와 A&lt;sup&gt;c&lt;/sup&gt;는 배반사건[A&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;=&lt;span&gt;&amp;oslash;&lt;/span&gt;]이므로&lt;br /&gt;&amp;nbsp;&amp;there4; P(A)=1-P(A&lt;sup&gt;c&lt;/sup&gt;)&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp; ② &lt;b&gt;P(&amp;oslash;) = 0&lt;/b&gt;&lt;/b&gt;&lt;/p&gt;
&lt;div data-ke-type=&quot;moreLess&quot; data-text-more=&quot;더보기&quot; data-text-less=&quot;닫기&quot;&gt;&lt;a class=&quot;btn-toggle-moreless&quot;&gt;더보기&lt;/a&gt;
&lt;div class=&quot;moreless-content&quot;&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 100%;&quot;&gt;1=P(S)=P(S&amp;cup;&amp;oslash;)=P(S)+P(&amp;oslash;)&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;rarr;&amp;nbsp; S와 &amp;oslash;는 배반사건[S&amp;cap;&amp;oslash;=&lt;span&gt;&amp;oslash;&lt;/span&gt;]이므로&lt;br /&gt;&amp;nbsp;&amp;there4; P(&amp;oslash;)=1-P(S)=0&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp; ③ A&amp;sub;B이면 P(A)&amp;le;P(B)&lt;/b&gt;&lt;/p&gt;
&lt;div data-ke-type=&quot;moreLess&quot; data-text-more=&quot;더보기&quot; data-text-less=&quot;닫기&quot;&gt;&lt;a class=&quot;btn-toggle-moreless&quot;&gt;더보기&lt;/a&gt;
&lt;div class=&quot;moreless-content&quot;&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 100%;&quot;&gt;B=A&amp;cup;(B&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;)&amp;nbsp;&amp;nbsp;,&amp;nbsp; A&amp;cap;(B&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;)=&lt;span&gt;&amp;oslash;이므로&lt;/span&gt;&lt;br /&gt;&amp;nbsp;&amp;there4; P(A)&amp;le;P(B)&amp;nbsp; =&amp;nbsp; P(A&amp;cup;(B&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;) &amp;nbsp;= &amp;nbsp;P(A) + P(B&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;)&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp; ④&amp;nbsp;0&amp;le;P(A)&amp;le;1&lt;/b&gt;&lt;/p&gt;
&lt;div data-ke-type=&quot;moreLess&quot; data-text-more=&quot;더보기&quot; data-text-less=&quot;닫기&quot;&gt;&lt;a class=&quot;btn-toggle-moreless&quot;&gt;더보기&lt;/a&gt;
&lt;div class=&quot;moreless-content&quot;&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 100%;&quot;&gt;&lt;span&gt;&amp;oslash;&amp;sub;A&amp;sub;S에서 정리③에 의해 P(&lt;span&gt;&amp;oslash;)&amp;sub;P(A)&amp;sub;P(S)&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&amp;nbsp;&amp;there4; 0&amp;le;P(A)&amp;le;1&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp;&amp;nbsp;⑤ P(A&amp;cup;B)=P(A)+P(B)-P(A&amp;cap;B)&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;rarr; 확률의 덧셈정리&lt;/b&gt;&lt;/p&gt;
&lt;div data-ke-type=&quot;moreLess&quot; data-text-more=&quot;더보기&quot; data-text-less=&quot;닫기&quot;&gt;&lt;a class=&quot;btn-toggle-moreless&quot;&gt;더보기&lt;/a&gt;
&lt;div class=&quot;moreless-content&quot;&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 100%;&quot;&gt;P(A&amp;cup;B)&amp;nbsp; =&amp;nbsp; P(A&amp;cup;(B&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;))&amp;nbsp; = &amp;nbsp;P(A) + P(B&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;)&lt;span&gt; &amp;nbsp;&amp;nbsp; &amp;rarr;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;A와 B&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;가 배반사건[A&amp;cap;(B&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;)]&amp;nbsp;&lt;/span&gt;&lt;br /&gt;P(B)&amp;nbsp; =&amp;nbsp; P[(A&amp;cap;B)&amp;cup;(B&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;)] &amp;nbsp;= P(A&amp;cap;B) + P(B&amp;cap;A&lt;sup&gt;c&lt;/sup&gt;)&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;rarr; A&amp;cap;B와 B&amp;cap;Ac가 배반사건[P(A&amp;cap;B)&amp;cap;P(B&amp;cap;Ac)=&lt;span&gt;&amp;oslash;&lt;/span&gt;]&lt;br /&gt;&lt;span&gt;&amp;there4; P(A&amp;cup;B)&amp;nbsp;&amp;nbsp;=&amp;nbsp; P(A) + P(B) - P(A&amp;cap;B)&amp;nbsp;&lt;/span&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp; ⑥ P(A&amp;cup;BUC)=P(A)+P(B)+P(C)-P(A&amp;cap;B)-P(&lt;b&gt;A&amp;cap;C)-P(B&lt;b&gt;&amp;cap;C)+P(&lt;b&gt;A&amp;cap;B&lt;/b&gt;&lt;b&gt;&amp;cap;C)&lt;/b&gt;&lt;/b&gt;&lt;/b&gt;&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;확률변수의 종류&lt;/h4&gt;
&lt;p&gt;확률변수는 0이 아닌 확률을 갖는 실수값의 형태에 따라 이산형확률변수와 연속형 확률변수로 구분된다.&lt;/p&gt;
&lt;table style=&quot;width: 100%; height: 139px; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr style=&quot;height: 38px;&quot;&gt;
&lt;td style=&quot;width: 26%; height: 38px; text-align: center;&quot;&gt;&lt;b&gt;확률 변수의 종류&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 38.77%; height: 38px; text-align: center;&quot;&gt;&lt;b&gt;이산형 확률변수&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Discrete Random Variable]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 35.17%; height: 38px; text-align: center;&quot;&gt;&lt;b&gt;연속형 확률변수&lt;/b&gt;&lt;br /&gt;&lt;b&gt;[Continuous Random Variable]&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr style=&quot;height: 38px;&quot;&gt;
&lt;td style=&quot;width: 26%; height: 38px; text-align: center;&quot;&gt;&lt;b&gt;&amp;nbsp;정 의&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 38.77%; height: 38px; text-align: center;&quot;&gt;확률 변수 X가 유한 집합이거나 자연수의 부분집합과 일대일 대응일 때의 확률변수&lt;/td&gt;
&lt;td style=&quot;width: 35.17%; height: 38px; text-align: center;&quot;&gt;임의의 구간을 설정해도 구간 내의 값을 측정할 수&amp;nbsp;없는 확률변수&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 26%; text-align: center;&quot;&gt;&lt;b&gt;확률분포함수&lt;br /&gt;&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 38.77%; text-align: center;&quot;&gt;확률질량함수&lt;/td&gt;
&lt;td style=&quot;width: 35.17%; text-align: center;&quot;&gt;확률밀도함수&lt;/td&gt;
&lt;/tr&gt;
&lt;tr style=&quot;height: 19px;&quot;&gt;
&lt;td style=&quot;width: 26%; height: 19px; text-align: center;&quot;&gt;&lt;b&gt;확률변수X의 기대값&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 38.77%; height: 19px; text-align: center;&quot;&gt;E(X) = &amp;sum;x&lt;i&gt;&lt;sub&gt;i&lt;/sub&gt;&lt;/i&gt;f(x&lt;i&gt;&lt;sub&gt;i&lt;/sub&gt;&lt;/i&gt;)&lt;/td&gt;
&lt;td style=&quot;width: 35.17%; height: 19px; text-align: center;&quot;&gt;E(X) = &amp;int;xf(x)dx&lt;/td&gt;
&lt;/tr&gt;
&lt;tr style=&quot;height: 22px;&quot;&gt;
&lt;td style=&quot;width: 26%; height: 22px; text-align: center;&quot;&gt;&lt;b&gt;확률변수X의 k차 적률&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 38.77%; height: 22px; text-align: center;&quot;&gt;E(X&lt;sup&gt;k&lt;/sup&gt;) = &amp;sum;x&lt;i&gt;&lt;sub&gt;i&lt;/sub&gt;&lt;/i&gt;&lt;sup&gt;k&lt;/sup&gt;f(x&lt;i&gt;&lt;sub&gt;i&lt;/sub&gt;&lt;/i&gt;)&lt;/td&gt;
&lt;td style=&quot;width: 35.17%; height: 22px; text-align: center;&quot;&gt;E(X&lt;sup&gt;k&lt;/sup&gt;) = &amp;int;x&lt;sup&gt;k&lt;/sup&gt;f(x)dx&lt;/td&gt;
&lt;/tr&gt;
&lt;tr style=&quot;height: 22px;&quot;&gt;
&lt;td style=&quot;width: 26%; height: 22px; text-align: center;&quot;&gt;&lt;b&gt;확률변수[X]의 k차 중심적률&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 38.77%; height: 22px; text-align: center;&quot;&gt;E[(X-&lt;span&gt;&amp;mu;&lt;/span&gt;)&lt;sup&gt;k&lt;/sup&gt;] = &amp;sum;(x&lt;i&gt;&lt;sub&gt;i&lt;/sub&gt;&lt;/i&gt;-&lt;span&gt;&amp;mu;&lt;/span&gt;)&lt;sup&gt;k&lt;/sup&gt;f(x&lt;i&gt;&lt;sub&gt;i&lt;/sub&gt;&lt;/i&gt;)&lt;/td&gt;
&lt;td style=&quot;width: 35.17%; height: 22px; text-align: center;&quot;&gt;E[(X-&lt;span&gt;&amp;mu;&lt;/span&gt;)&lt;sup&gt;k&lt;/sup&gt;] = &amp;int;(x-&lt;span&gt;&amp;mu;&lt;/span&gt;)&lt;sup&gt;k&lt;/sup&gt;f(x)&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;# 모분산[Population Variance, &amp;sigma;&lt;sup&gt;2&lt;/sup&gt;]&lt;/b&gt;&lt;/span&gt;&lt;/p&gt;
&lt;div data-ke-type=&quot;moreLess&quot; data-text-more=&quot;더보기&quot; data-text-less=&quot;닫기&quot;&gt;&lt;a class=&quot;btn-toggle-moreless&quot;&gt;더보기&lt;/a&gt;
&lt;div class=&quot;moreless-content&quot;&gt;
&lt;p&gt;&lt;span&gt;&amp;sigma;&lt;sup&gt;2&lt;/sup&gt;&amp;nbsp; =&amp;nbsp; E[(X-&lt;span&gt;&amp;mu;&lt;/span&gt;)&lt;sup&gt;2&lt;/sup&gt;]&amp;nbsp; =&amp;nbsp; E[(X&lt;sup&gt;2&lt;/sup&gt;-2&amp;mu;X+&lt;span&gt;&amp;mu;&lt;sup&gt;2&lt;/sup&gt;&lt;/span&gt;)]&amp;nbsp; =&amp;nbsp; E(X&lt;sup&gt;2&lt;/sup&gt;)-2&amp;mu;E(X)+&lt;span&gt;&amp;mu;&lt;sup&gt;2&lt;/sup&gt;&lt;/span&gt; =&amp;nbsp; E(X&lt;sup&gt;2&lt;/sup&gt;)-&lt;span&gt;&amp;mu;&lt;sup&gt;2&lt;/sup&gt;&lt;/span&gt;&lt;/span&gt;&lt;span&gt;&lt;span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;p&gt;즉, 모분산은 [2차적률-(1차적률)&lt;sup&gt;2&lt;/sup&gt;]으로 해석 가능&lt;/p&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;순열[Permutation]과 조합[Combination]&lt;/h4&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 23.47%; text-align: center;&quot;&gt;&lt;b&gt;순열[Permutation]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 76.5%;&quot;&gt;순서고려&lt;br /&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;15948.jpg&quot; data-origin-width=&quot;217&quot; data-origin-height=&quot;59&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/rsHHB/btqQDF5PDdS/G5TkeFJBsecC0dl2TVSc50/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/rsHHB/btqQDF5PDdS/G5TkeFJBsecC0dl2TVSc50/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/rsHHB/btqQDF5PDdS/G5TkeFJBsecC0dl2TVSc50/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FrsHHB%2FbtqQDF5PDdS%2FG5TkeFJBsecC0dl2TVSc50%2Fimg.jpg&quot; data-filename=&quot;15948.jpg&quot; data-origin-width=&quot;217&quot; data-origin-height=&quot;59&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 23.47%; text-align: center;&quot;&gt;&lt;b&gt;조합[Combination]&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 76.5%;&quot;&gt;순서고려 X&lt;br /&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;15948 - 복사본.jpg&quot; data-origin-width=&quot;231&quot; data-origin-height=&quot;58&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/xnXzW/btqFbClXsId/nOowGQKGy6TSx22KxQVNSk/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/xnXzW/btqFbClXsId/nOowGQKGy6TSx22KxQVNSk/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/xnXzW/btqFbClXsId/nOowGQKGy6TSx22KxQVNSk/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FxnXzW%2FbtqFbClXsId%2FnOowGQKGy6TSx22KxQVNSk%2Fimg.jpg&quot; data-filename=&quot;15948 - 복사본.jpg&quot; data-origin-width=&quot;231&quot; data-origin-height=&quot;58&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;복원추출 &amp;amp; 비복원 추출&lt;/h4&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 24.88%;&quot;&gt;복원추출&lt;/td&gt;
&lt;td style=&quot;width: 75.11%;&quot;&gt;다음 표본 추출 전 추출된 표본이 복원되는 추출 방법&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 24.88%;&quot;&gt;비복원추출&lt;/td&gt;
&lt;td style=&quot;width: 75.11%;&quot;&gt;추출된 표본이 복원되지 않는 추출 방법&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;b&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;# 초기하 분포[Hypergeometric Distribution]&lt;/span&gt;&lt;/b&gt;&lt;/p&gt;
&lt;div data-ke-type=&quot;moreLess&quot; data-text-more=&quot;더보기&quot; data-text-less=&quot;닫기&quot;&gt;&lt;a class=&quot;btn-toggle-moreless&quot;&gt;더보기&lt;/a&gt;
&lt;div class=&quot;moreless-content&quot;&gt;
&lt;p&gt;크기가 유한한 모집단으로부터 비복원 추출 시 나타나는 확률분포&lt;/p&gt;
&lt;table style=&quot;width: 100%; border-collapse: collapse;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 100%;&quot;&gt;ex&amp;gt; n = n1 + n2일때, r개 추출&lt;br /&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;1232.jpg&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/CoGjF/btqFdmWNxYM/WOWCYkoTKqh2TCWKo2PCjK/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/CoGjF/btqFdmWNxYM/WOWCYkoTKqh2TCWKo2PCjK/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/CoGjF/btqFdmWNxYM/WOWCYkoTKqh2TCWKo2PCjK/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FCoGjF%2FbtqFdmWNxYM%2FWOWCYkoTKqh2TCWKo2PCjK%2Fimg.jpg&quot; data-filename=&quot;1232.jpg&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 100%;&quot;&gt;ex&amp;gt; 100개[양품80, 불량20개] 중 5개를 추출할 때, 불량품이 0개인 확률은?&lt;br /&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;1232 - 복사본.jpg&quot; data-origin-width=&quot;377&quot; data-origin-height=&quot;95&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/HfxUp/btqFcOzenMN/fxTzAqyhwSYSwtsTkUZoeK/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/HfxUp/btqFcOzenMN/fxTzAqyhwSYSwtsTkUZoeK/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/HfxUp/btqFcOzenMN/fxTzAqyhwSYSwtsTkUZoeK/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FHfxUp%2FbtqFcOzenMN%2FfxTzAqyhwSYSwtsTkUZoeK%2Fimg.jpg&quot; data-filename=&quot;1232 - 복사본.jpg&quot; data-origin-width=&quot;377&quot; data-origin-height=&quot;95&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;이항정리&lt;/b&gt;&lt;/h4&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;adsp123159.jpg&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/1AVJq/btqFdng6Wt0/rOBiO6cLHy43d9OQt0WaKK/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/1AVJq/btqFdng6Wt0/rOBiO6cLHy43d9OQt0WaKK/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/1AVJq/btqFdng6Wt0/rOBiO6cLHy43d9OQt0WaKK/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2F1AVJq%2FbtqFdng6Wt0%2FrOBiO6cLHy43d9OQt0WaKK%2Fimg.jpg&quot; data-filename=&quot;adsp123159.jpg&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p style=&quot;text-align: left;&quot;&gt;&lt;b&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 이항정리의 일반화[다항정리]&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;adsp123159 - 복사본.jpg&quot; data-origin-width=&quot;386&quot; data-origin-height=&quot;89&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/djHlPa/btqFa618360/onVkrpjWLkYwJxLEMlSkYK/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/djHlPa/btqFa618360/onVkrpjWLkYwJxLEMlSkYK/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/djHlPa/btqFa618360/onVkrpjWLkYwJxLEMlSkYK/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FdjHlPa%2FbtqFa618360%2FonVkrpjWLkYwJxLEMlSkYK%2Fimg.jpg&quot; data-filename=&quot;adsp123159 - 복사본.jpg&quot; data-origin-width=&quot;386&quot; data-origin-height=&quot;89&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;b&gt;파스칼 정리&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;123579.jpg&quot; data-origin-width=&quot;270&quot; data-origin-height=&quot;62&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/rHejW/btqFbUtckFe/bv06XFlS4pRInsMLyk4ge1/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/rHejW/btqFbUtckFe/bv06XFlS4pRInsMLyk4ge1/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/rHejW/btqFbUtckFe/bv06XFlS4pRInsMLyk4ge1/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FrHejW%2FbtqFbUtckFe%2Fbv06XFlS4pRInsMLyk4ge1%2Fimg.jpg&quot; data-filename=&quot;123579.jpg&quot; data-origin-width=&quot;270&quot; data-origin-height=&quot;62&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;n개 중 r개를 뽑는 확률은 n-1개 중[1개를 미리 뽑았을 때] r개에 포함이 됨 경우와 안된 경우의 합&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;조건부확률&lt;/b&gt;&lt;/h4&gt;
&lt;p&gt;사건 B가 주어졌을 때 사건 A가 일어날 확률 [P(A|B)]&lt;/p&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;adsp1564.jpg&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/b5XShq/btqFbV6HBuM/ye0eecz6RCKZJHbYAHBoLk/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/b5XShq/btqFbV6HBuM/ye0eecz6RCKZJHbYAHBoLk/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/b5XShq/btqFbV6HBuM/ye0eecz6RCKZJHbYAHBoLk/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fb5XShq%2FbtqFbV6HBuM%2Fye0eecz6RCKZJHbYAHBoLk%2Fimg.jpg&quot; data-filename=&quot;adsp1564.jpg&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 확률의 곱셈법칙&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;adsp1564 - 복사본.jpg&quot; data-origin-width=&quot;301&quot; data-origin-height=&quot;68&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/0wGji/btqFbWdtnKj/I0CwN25BUxPGmqc5UEkTl1/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/0wGji/btqFbWdtnKj/I0CwN25BUxPGmqc5UEkTl1/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/0wGji/btqFbWdtnKj/I0CwN25BUxPGmqc5UEkTl1/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2F0wGji%2FbtqFbWdtnKj%2FI0CwN25BUxPGmqc5UEkTl1%2Fimg.jpg&quot; data-filename=&quot;adsp1564 - 복사본.jpg&quot; data-origin-width=&quot;301&quot; data-origin-height=&quot;68&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 전확률의 정리&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;123456789.jpg&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/z63Yj/btqFcN1rGQE/cINOsCIrdBHSev5oHry6l0/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/z63Yj/btqFcN1rGQE/cINOsCIrdBHSev5oHry6l0/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/z63Yj/btqFcN1rGQE/cINOsCIrdBHSev5oHry6l0/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fz63Yj%2FbtqFcN1rGQE%2FcINOsCIrdBHSev5oHry6l0%2Fimg.jpg&quot; data-filename=&quot;123456789.jpg&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;베이즈 정리&lt;/b&gt;&lt;/h4&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;adsp12345679.jpg&quot; data-origin-width=&quot;878&quot; data-origin-height=&quot;91&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/kBP5m/btqFcvfCfTA/RcKJpCHRKKaPRiRWd2qFGk/img.jpg&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/kBP5m/btqFcvfCfTA/RcKJpCHRKKaPRiRWd2qFGk/img.jpg&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/kBP5m/btqFcvfCfTA/RcKJpCHRKKaPRiRWd2qFGk/img.jpg&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FkBP5m%2FbtqFcvfCfTA%2FRcKJpCHRKKaPRiRWd2qFGk%2Fimg.jpg&quot; data-filename=&quot;adsp12345679.jpg&quot; data-origin-width=&quot;878&quot; data-origin-height=&quot;91&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;독립사건&lt;/b&gt;&lt;/h4&gt;
&lt;p&gt;사건 A와 B가 서로 독립인 필요충분조건은 P(A&amp;cap;B)=P(A)XP(B)이다.&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;P(A|B) = P(A)&lt;/li&gt;
&lt;li&gt;사건 A와 B가 독립이면 A와 B&lt;sup&gt;c&lt;/sup&gt;, A&lt;sup&gt;c&lt;/sup&gt;와 B, A&lt;sup&gt;c&lt;/sup&gt;와 B&lt;sup&gt;c&lt;/sup&gt;도 모두 독립&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;</description>
      <category>자격증/ADsP</category>
      <category>ADsP</category>
      <category>독립사건</category>
      <category>베이즈정리</category>
      <category>복원추출</category>
      <category>비복원추출</category>
      <category>순열</category>
      <category>이항정리</category>
      <category>조건부확률</category>
      <category>파스칼정리</category>
      <category>확률</category>
      <author>IT개미 데이터</author>
      <guid isPermaLink="true">https://2030bigdata.tistory.com/247</guid>
      <comments>https://2030bigdata.tistory.com/247#entry247comment</comments>
      <pubDate>Sun, 14 Feb 2021 17:17:39 +0900</pubDate>
    </item>
    <item>
      <title>[개미의 걸음 ADsP 3과목] EDA &amp;amp; 결측치 및 이상치 처리</title>
      <link>https://2030bigdata.tistory.com/255</link>
      <description>&lt;h3 data-ke-size=&quot;size23&quot;&gt;&lt;b&gt;탐색적 자료분석[EDA, Explonatory Data Analysis]&lt;/b&gt;&lt;/h3&gt;
&lt;p&gt;데이터가 가지고 있는 특성을 파악하기 위해 해당 변수의 분포 등을 시각화하여 분석하는 분석 방법&lt;/p&gt;
&lt;ul data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;미국의 존 튜키교수가 1977년 발표한 저서에 EDA가 처음으로 언급&lt;/li&gt;
&lt;li&gt;당시 주로 사용하던 확증적분석[CDA, Confirmatory Data Analysis]는 가설을 검증하는데 주로 사용되었지만&lt;br /&gt;EDA는 자료를 하나의 목적으로 보징낳고 여러 방면으로 바라보기 위해 고안되었다.&lt;/li&gt;
&lt;li&gt;다양한 차원과 값을 조합하여 특이한 점이나 의미있는 사실을 도출하고 분석의 최종 목적을 달성해가는 과정&lt;/li&gt;
&lt;li&gt;데이터의 특징과 내재하는 구조적 관계를 알아내기 위한 기법들의 총칭&lt;/li&gt;
&lt;li&gt;데이터에 대한 전반적인 이해를 통해 분석 가능한 데이터인지 확인하는 단계&lt;br /&gt;[함수를 적용하는 것이 아닌 데이터 자체를 확인하는 것!]&lt;/li&gt;
&lt;li&gt;데이터에 포함된 변수의 유형이 어떻게 되는지를 찾아가는 과정&lt;/li&gt;
&lt;li&gt;탐색적 데이터 분석을 통해 얻은 정보를 이용해 통계적 가설이나 모형을 설정해 연구하거나 의사결정에 이용해 정보의 정확도를 측정&lt;/li&gt;
&lt;li&gt;알고리즘이 학습을 얼마나 잘하는지는 전적으로 데이터 품질과 데이터에 담긴 정보량에 달림&lt;/li&gt;
&lt;li&gt;Boxplot을 그리면 이상치의 식별이 쉬움&lt;/li&gt;
&lt;li&gt;summary( )함수를 사용하면 데이터의 기초통계량을 파악 가능&lt;br /&gt;&amp;nbsp; &amp;nbsp; 수치형변수 : 최소값, 1사분위수, 2사분위수(중앙값), 3사분위수, 최대값, 평균&lt;br /&gt;&amp;nbsp; &amp;nbsp; 명목형변수 : 명목값, 데이터 개수&lt;/li&gt;
&lt;li&gt;head( )함수를 사용하면 많은 데이터 중 일부의 데이터만 가져올 수 있음&lt;br /&gt;&amp;nbsp; &amp;nbsp; 기본적으로 6개의 데이터가 보여지며 보고싶은 데이터의 개수 지정 가능&lt;/li&gt;
&lt;li&gt;EDA는 시간이 오래 걸리는 일이므로 최근에는 EDA를 자동으로 신속하게 수행해 유의미한 값만 파악해 데이터 마트로 만든 후 모델링 업무로 진행하는게 일반적&lt;/li&gt;
&lt;li&gt;데이터를 시각화(Box Plot, 상자그림)하면 이상치 식별이 용이&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; EDA의 4가지 주제&lt;/b&gt;&lt;/p&gt;
&lt;table style=&quot;border-collapse: collapse; width: 100%;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;span style=&quot;color: #ee2323;&quot;&gt;&lt;b&gt;저항성 강조&lt;/b&gt;&lt;/span&gt;&lt;/td&gt;
&lt;td&gt;저항적인 자료/분석은 자료의 일부 변동에 따른 영향을 비교적으로 적게 받는 것을 의미&lt;br /&gt;즉, 이상치, 결측치, 입력 오류등의 영향을 적게 받음&lt;br /&gt;ex&amp;gt; median, 사분위수, IQR 등&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;span style=&quot;color: #ee2323;&quot;&gt;&lt;b&gt;잔차[오차] 계산&lt;/b&gt;&lt;/span&gt;&lt;/td&gt;
&lt;td&gt;잔차[개별 관측값의 흐름에서 벗어난 값]가 있을 때 왜 이런 값이 발생했는지 파악하는 것&lt;br /&gt;Residual Analysis[Regression Analysis] : 잔차분석[회귀분석]&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;span style=&quot;color: #ee2323;&quot;&gt;&lt;b&gt;자료변수의 재표현&lt;/b&gt;&lt;/span&gt;&lt;/td&gt;
&lt;td&gt;자료 분석을 단순화할 수 있도록 원래의 변수를 적당한 척도로 바꾸는 것을 의미&lt;br /&gt;ex&amp;gt; Z-score[표준점수] 등&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;span style=&quot;color: #ee2323;&quot;&gt;&lt;b&gt;그래프를 통한 현시성&lt;/b&gt;&lt;/span&gt;&lt;/td&gt;
&lt;td&gt;그래픽 표현을 통해 자료 안에 숨겨진 정보를 효율적으로 활용할 수 있게 해줌&lt;br /&gt;현시성은 데이터 시각화라고도 불림&lt;br /&gt;ex&amp;gt; 줄기와 잎 그림, Boxplot 등&amp;nbsp;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; EDA VS Traditional Analysis&lt;/b&gt;&lt;/p&gt;
&lt;table style=&quot;border-collapse: collapse; width: 100%;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;&lt;b&gt;Traditional Analysis&lt;/b&gt;&lt;/b&gt;&lt;/td&gt;
&lt;td&gt;&lt;b&gt;EDA&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Frequency Distribution&lt;/td&gt;
&lt;td&gt;Stem and leaf plot&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Histogram&lt;/td&gt;
&lt;td&gt;Boxplot&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Mean&lt;/td&gt;
&lt;td&gt;Median&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Standard Deviation&lt;/td&gt;
&lt;td&gt;InterQuartile Range[IQR]&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h2 data-ke-size=&quot;size26&quot;&gt;&lt;b&gt;결측치 처리&lt;/b&gt;&lt;/h2&gt;
&lt;p&gt;결측치는 NA, 99999999, 공백, Unknown, Not Answer 등으로 표현&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;결측치 처리는 전체 작업 속도에 크게 영향을 미침&lt;/li&gt;
&lt;li&gt;결측치를 처리하기 위해 시간을 많이 사용하는 것은 비효율적!&lt;/li&gt;
&lt;li&gt;간혹 결측값 자체가 의미가 있는 경우도 있음&lt;br /&gt;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;rarr; ex&amp;gt; 카드 가입자 중 이용실적이 전혀 없는 경우&lt;/li&gt;
&lt;li&gt;NaN[Not a Number]는 결측값이 아니라 숫자형 데이터 자리에 숫자 외의 문자가 오는 경우를 의미&lt;/li&gt;
&lt;li&gt;결측치 처리방법은 크게 단순 대치법과 다중 대치법이 있음&amp;nbsp;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&lt;b&gt;결측치 처리 방법&lt;/b&gt;&lt;/h3&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;① 단순 대치법[Single Imputation]&lt;/h4&gt;
&lt;p&gt;&amp;nbsp; 1) 완전분석법(completes analysis)&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;결측치가 존재하는 레코드를 삭제하는 방법&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp; 2) 평균 대치법(Mean Imputation)&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;관측, 실험 등을 통해 얻어진 데이터의 평균으로 결측치를 대치하는 방법&lt;/li&gt;
&lt;li&gt;조건부 평균 대치법 : 회귀분석을 활용한 대치법&lt;br /&gt;비조건부 평균 대치법 : 관측데이터의 평균을 활용한 대치법&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp; 3) 단순확률 대치법(Single Stochastic Imputation)&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;평균대치법에서 추정량 표준 오차의 과소 추정문제를 보완하고자 고안된 방법&lt;/li&gt;
&lt;li&gt;Hot-deck, Nearest neighbor 등의 종류가 있음&lt;/li&gt;
&lt;/ul&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;② 다중 대치법[Multiple Imputation]&lt;/h4&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;단순 대치법을 여러 번 대치하여 여러 개의 완전한 자료를 생성하는 방법&lt;br /&gt;&amp;nbsp; &amp;nbsp; ex&amp;gt; n번 대치를 통해 n개의 완전한 자료 생성&lt;/li&gt;
&lt;li&gt;1단계 : 대치(Imputation Step)&lt;br /&gt;2단계 : 분석(Analysis Step)&lt;br /&gt;3단계 : 결합(Combination Step)&amp;nbsp;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&lt;b&gt;R에서의 결측치 처리&lt;/b&gt;&lt;/h3&gt;
&lt;table style=&quot;border-collapse: collapse; width: 100%;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.0698%; text-align: center;&quot;&gt;complete.cases( )&lt;/td&gt;
&lt;td style=&quot;width: 80.9302%;&quot;&gt;데이터가 완전한 데이터인지 확인하는 함수&lt;br /&gt;데이터 셋 안에 결측값이 있으면 FALSE, 없으면 TRUE로 반환&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.0698%; text-align: center;&quot;&gt;is.na( )&lt;/td&gt;
&lt;td style=&quot;width: 80.9302%;&quot;&gt;결측치가 있는지 확인하는 함수&lt;br /&gt;결측치을 NA로 인식해 결측값이 있으면 TRUE, 없으면 FALSE로 반환&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.0698%; text-align: center;&quot;&gt;centralImputation( )&lt;br /&gt;[DMwR 패키지]&lt;/td&gt;
&lt;td style=&quot;width: 80.9302%;&quot;&gt;NA값을 Central Value로 대치하는 함수&lt;br /&gt;숫자는 중위수, 요인(factor)은 최빈값으로 대치&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.0698%; text-align: center;&quot;&gt;knnImputation( )&lt;br /&gt;[DMwR 패키지]&lt;/td&gt;
&lt;td style=&quot;width: 80.9302%;&quot;&gt;NA값을 k최근 이웃 분류 알고리즘을 사용하여 대치하는 함수&lt;br /&gt;k개 주변 이웃까지의 거리를 고려하여 가중 평균한 값을 사용&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.0698%; text-align: center;&quot;&gt;amelia( )&lt;br /&gt;[Amelia 패키지]&lt;/td&gt;
&lt;td style=&quot;width: 80.9302%;&quot;&gt;TIME-SERIES-CROSS-SECTIONAL DATA SET에서 활용&lt;br /&gt;랜덤포레스트(random forest)모델은 결측값이 존재할 경우, 바로 에러가 발생&lt;br /&gt;randomForest 패키지의 rfImpute( )함수를 활용해 NA 결측치를 대치한 후 알고리즘에 적용&lt;br /&gt;&amp;nbsp; &amp;nbsp; &lt;span style=&quot;color: #333333;&quot;&gt;&amp;rarr; randomForest모형의 경우, 결측치가 있으면 에러가 발생&lt;br /&gt;&amp;nbsp; &amp;nbsp; &lt;span style=&quot;color: #333333;&quot;&gt;&amp;rarr; rfImpute( )함수는 randomForest 패키지에서 결측치(NA)를 대치하도록 하는 함수&lt;/span&gt;&amp;nbsp;&lt;/span&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h2 data-ke-size=&quot;size26&quot;&gt;&lt;b&gt;이상치 처리&lt;/b&gt;&lt;/h2&gt;
&lt;p&gt;이상치는 정상범주에서 크게 벗어난 값을 의미[설명변수의 관측치에 비해 종속변수의 값이 상이한 값]&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;의도하지 않게 잘못 입력한 것을 이상치라고 함[Bad Data]&lt;/li&gt;
&lt;li&gt;의도하지 않게 입력되었으나 분석 목적에 부합되지 않아 제거해야 하는 것을 이상치라고 함[Bad Data]&lt;/li&gt;
&lt;li&gt;의도하지 않은 현상이지만 분석에 포함해야 하는 것을 이상치라고 함&lt;/li&gt;
&lt;li&gt;의도된 이상값을 이상치라고 함&lt;/li&gt;
&lt;li&gt;Bad Data로 판명된 데이터는 삭제하는 것이 바람직!!&lt;/li&gt;
&lt;li&gt;이상치는 반드시 제거해야 하는 것이 아니므로 분석의 목적에 맞게 적절한 판단이 필요&lt;/li&gt;
&lt;li&gt;이상치는 제거하는 것보다 조정 방법을 사용해 값을 대치하는 것이 데이터 손실율도 적고, 설명력도 높아짐&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&lt;b&gt;이상치 관측&lt;/b&gt;&lt;/h3&gt;
&lt;p&gt;① ESD[Extreme Studentized Deviation]&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;평균으로부터 3 표준편차 떨어진 값&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;② 기하평균과 표준편차를 활용&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;이상값 정의 : &quot;기하평균 - 2.5 X 표준편차 &amp;lt; data &amp;lt; 기하평균 + 2.5 X 표준편차&quot;를 벗어난 값&lt;/li&gt;
&lt;li&gt;geo_mean을 활용해 기하평균을 구함&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;③ 사분위수를 활용&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;이상치는 변수의 분포를 벗어난 값으로 상자 그림을 통해 확인 가능&lt;/li&gt;
&lt;li&gt;상자 그림의 outer fence 밖에 있는 값(이상치) 제거&lt;/li&gt;
&lt;li&gt;이상값 정의 : &quot;Q1 - 1.5(Q3 - Q1) &amp;lt; data &amp;lt; Q3+1.5(Q3 - Q1)&quot;를 벗어난 값&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&lt;b&gt;이상치 처리 방법&lt;/b&gt;&lt;/h3&gt;
&lt;p&gt;이상치를 처리하는 방법에는 크게 절단(trimming)과 조정(winsorizing)이 있음&lt;/p&gt;
&lt;p&gt;① Trimming&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;이상치 절단 방법에는 기하평균과, 상단*하단 %를 이용한 제거가 있음&lt;/li&gt;
&lt;li&gt;상단*하단 %를 이용할 때는 상하위 5%(총 10%)에 해당하는 데이터를 제거&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;② Winsorizing&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;상한값과 하한값을 벗어나는 값들을 하한, 상한값으로 대치&lt;/li&gt;
&lt;li&gt;상자수염그림에서 IQR의 약 1.5배를 벗어난 데이터를 이상치로 분류&lt;/li&gt;
&lt;li&gt;IQR[Inter Quartile Range]는 3Q에서 1Q를 뺀 값&lt;/li&gt;
&lt;li&gt;1Q, 3Q로부터 IQR의 1.5배되는 지점을 상한값, 하한값이라고 함&amp;nbsp;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;이상치 활용의 예&lt;/h3&gt;
&lt;p&gt;사기탐지 - 평상시의 신용카드 구매패턴과 다른 패턴을 조사하여 도난여부 확인&lt;/p&gt;
&lt;p&gt;침입탐지 - 컴퓨터 네트워크에 대한 예외적인 행위를 감시하는 경우를 탐지&lt;/p&gt;
&lt;p&gt;&amp;nbsp;의&amp;nbsp; &amp;nbsp; 료 - 환자에게 보이는 예외적인 이상 증세를 발견함으로써 건강 이상 발견&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;</description>
      <category>자격증/ADsP</category>
      <author>IT개미 데이터</author>
      <guid isPermaLink="true">https://2030bigdata.tistory.com/255</guid>
      <comments>https://2030bigdata.tistory.com/255#entry255comment</comments>
      <pubDate>Sat, 13 Feb 2021 17:17:37 +0900</pubDate>
    </item>
    <item>
      <title>[개미의 걸음 ADsP 3과목] 데이터 가공(변수의 중요도 및 구간화)</title>
      <link>https://2030bigdata.tistory.com/253</link>
      <description>&lt;h2 data-ke-size=&quot;size26&quot;&gt;&lt;b&gt;변수[Variable]&lt;/b&gt;&lt;/h2&gt;
&lt;p data-ke-size=&quot;size18&quot;&gt;저장된 값[숫자, 문자, 논리값 등]이 바뀔 수 있는 값들을 임시로 보관해 놓기 위한 저장소&lt;/p&gt;
&lt;ul data-ke-list-type=&quot;disc&quot;&gt;
&lt;li data-ke-size=&quot;size18&quot;&gt;변수의 첫글자는 문자나 .(점, dot)로 시작하며, 그 이후에는 문자/숫자/dot/underline 을 사용 가능&lt;/li&gt;
&lt;li data-ke-size=&quot;size18&quot;&gt;대소문자를 구분해야 됨을 유의!&lt;/li&gt;
&lt;li data-ke-size=&quot;size18&quot;&gt;한 번 만들어 사용한 변수는 R을 종료할 때까지 사라지지 않는다.&lt;/li&gt;
&lt;li data-ke-size=&quot;size18&quot;&gt;하나의 변수는 다양한 유형의 값을 저장할 수 있다.&lt;/li&gt;
&lt;/ul&gt;
&lt;table style=&quot;border-collapse: collapse; width: 100%;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td rowspan=&quot;2&quot;&gt;&lt;b&gt;질적 변수&lt;/b&gt;&lt;/td&gt;
&lt;td&gt;명목형 변수&lt;/td&gt;
&lt;td&gt;이름을 기준으로 한 형태&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;순서형 변수&lt;/td&gt;
&lt;td&gt;순서가 있는 형태&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td rowspan=&quot;2&quot;&gt;&lt;b&gt;양적 변수&lt;/b&gt;&lt;/td&gt;
&lt;td&gt;연속 변수&lt;/td&gt;
&lt;td&gt;연속된 숫자로 구성&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;이산 변수&lt;/td&gt;
&lt;td&gt;떨어져 있는 숫자로 구성&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;변수 파악&lt;/b&gt;&lt;/h4&gt;
&lt;ul data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;데이터 분석을 위해서는 구성된 데이터의 변수들을 파악하는 것이 중요&lt;/li&gt;
&lt;li&gt;summary( )함수를 사용하면 해당 데이터 셋이 어떤 구조를 가지고 있는지 파악 가능&lt;br /&gt;&amp;nbsp; &amp;nbsp; 수치형변수 : 최소값, 1사분위수, 2사분위수(중앙값), 3사분위수, 최대값, 평균&lt;br /&gt;&amp;nbsp; &amp;nbsp; 명목형변수 : 명목값, 데이터 개수&lt;/li&gt;
&lt;li&gt;head( )함수를 사용하면 많은 데이터 중 일부의 데이터만 가져올 수 있음&lt;br /&gt;&amp;nbsp; &amp;nbsp; 기본적으로 6개의 데이터가 보여지며 보고싶은 데이터의 개수 지정 가능&amp;nbsp;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;변수의 중요도&lt;/b&gt;&lt;/h4&gt;
&lt;p&gt;모형을 생성하여 사용된 변수의 중요도를 정리&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;&lt;span style=&quot;color: #333333;&quot;&gt;변수 선택법과 유사한 개념&lt;/span&gt;&lt;/li&gt;
&lt;li&gt;&lt;span style=&quot;color: #333333;&quot;&gt;klaR 패키지는 특정 변수가 주어졌을 때 클래스가 어떻게 분류되는지에 대한 에러율을 계산해주고, 그래픽으로 결과를 보여주는 기능을 함&lt;/span&gt;&lt;/li&gt;
&lt;li&gt;&lt;span style=&quot;color: #333333;&quot;&gt;greedy.wilks( )는 종속변수에 가장 영향력을 미치는 변수에 가장 영향력을 미치는 변수를 wilks lambda를 활용해 세분화를 위한 stepwise forward 변수를 선택함으로써 변수의 중요도를 정리&lt;br /&gt;&amp;nbsp; &amp;nbsp; &lt;/span&gt;※ Wilk's Lambda = 집단 내 분산 / 총 분산&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;변수의 구간화&lt;/b&gt;&lt;/h4&gt;
&lt;p&gt;연속형 변수를 분석 목적에 활용하기 위해 변수를 구간화&amp;nbsp;&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;일반적으로 10진수 단위로 구간화&lt;/li&gt;
&lt;li&gt;보통 구간을 5개로 나누며 7개 이상의 구간은 잘 만들지 않음&lt;/li&gt;
&lt;li&gt;신용평가모델, 고객 세분화와 같은 시스템에서 모형에 활용하는 각 변수들을 구간화해서 구간별 점수를 산정하기 위해 많이 사용&lt;/li&gt;
&lt;li&gt;변수의 구간화 방법에는 binning과 의사결정나무 등이 있다.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;변수의 구간화 방법&lt;/b&gt;&lt;/h4&gt;
&lt;p&gt;① binning&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;신용평가모형의 개발에서 연속형 변수를 범주형 변수로 구간화하는데 자주 활용되는 방법&lt;/li&gt;
&lt;li&gt;bin은 '쓰레기통'이라는 뜻으로 연속형 변수를 정렬한 후 각각의 bin에 나눠 담아 범주형 변수로 구간화&amp;nbsp;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;② 의사결정나무&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;세분화 또는 예측에 활용되는 의사결정나무 모형을 사용해 입력변수들을 구간화&lt;/li&gt;
&lt;li&gt;의사결정나무를 사용하면 동일한 변수를 여러 개의 분리기준으로 사용 가능&lt;/li&gt;
&lt;li&gt;연속변수가 반복적으로 선택될 경우, 각각의 분리 기준값으로 연속형 변수를 구간화 가능&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;</description>
      <category>자격증/ADsP</category>
      <author>IT개미 데이터</author>
      <guid isPermaLink="true">https://2030bigdata.tistory.com/253</guid>
      <comments>https://2030bigdata.tistory.com/253#entry253comment</comments>
      <pubDate>Fri, 12 Feb 2021 17:17:44 +0900</pubDate>
    </item>
    <item>
      <title>[개미의 걸음 ADsP 3과목] 데이터 마트 ①  reshape 패키지</title>
      <link>https://2030bigdata.tistory.com/252</link>
      <description>&lt;h2 data-ke-size=&quot;size26&quot;&gt;&lt;span style=&quot;background-color: #f3c000;&quot;&gt;&lt;b&gt;reshape 패키지&lt;/b&gt;&lt;/span&gt;&lt;/h2&gt;
&lt;p&gt;데이터 마트를 생성할 수 있도록 데이터를 녹여서(Melt) 형상화(Cast)할 수 있는 R패키지&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;melt( ) : 쉬운 casting을 위해 데이터를 &lt;span style=&quot;color: #ee2323;&quot;&gt;&lt;b&gt;원하는 데이터의 형태로 바꿔주는 함수&lt;br /&gt;&lt;/b&gt;&lt;/span&gt;cast( ) : 원하는 형태의 데이터를 계산 또는 변형시켜 &lt;span style=&quot;color: #ee2323;&quot;&gt;&lt;b&gt;요약 형태로 만드는 함수&lt;/b&gt;&lt;/span&gt; &amp;nbsp;&lt;/li&gt;
&lt;li&gt;acast( ) : 벡터, 배열 형태로 결과를 보여줌&lt;br /&gt;dcast( ) : dataframe 형태로 결과를 보여줌&lt;/li&gt;
&lt;li&gt;패키지 설치 : install.packages(&quot;reshape2&quot;)&lt;br /&gt;패키지 연동 : library(reshape2)&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;ex&amp;gt; airquality data&lt;/p&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/cH7fm2/btqSsSokkhO/WPOv5QwvIiKq6FoXPwiGgk/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/cH7fm2/btqSsSokkhO/WPOv5QwvIiKq6FoXPwiGgk/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/cH7fm2/btqSsSokkhO/WPOv5QwvIiKq6FoXPwiGgk/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcH7fm2%2FbtqSsSokkhO%2FWPOv5QwvIiKq6FoXPwiGgk%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;data( )함수를 사용하면 데이터를 불러올 수 있음&lt;/li&gt;
&lt;li&gt;summary( )함수를 사용하면 해당 데이터 셋이 어떤 구조를 가지고 있는지 파악 가능&lt;br /&gt;&amp;nbsp; &amp;nbsp; 수치형변수 : 최소값, 1사분위수, 2사분위수(중앙값), 3사분위수, 최대값, 평균&lt;br /&gt;&amp;nbsp; &amp;nbsp; 명목형변수 : 명목값, 데이터 개수&lt;/li&gt;
&lt;li&gt;head( )함수를 사용하면 많은 데이터 중 일부의 데이터만 가져올 수 있음&lt;br /&gt;&amp;nbsp; &amp;nbsp; 기본적으로 6개의 데이터가 보여지며 보고싶은 데이터의 개수 지정 가능&amp;nbsp;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/ciQKD2/btqSGjmq7pc/4Wr1roDIJSTxV1WKW1lxl1/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/ciQKD2/btqSGjmq7pc/4Wr1roDIJSTxV1WKW1lxl1/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/ciQKD2/btqSGjmq7pc/4Wr1roDIJSTxV1WKW1lxl1/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FciQKD2%2FbtqSGjmq7pc%2F4Wr1roDIJSTxV1WKW1lxl1%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;names( )함수를 사용하면 변수만 확인 가능&lt;/li&gt;
&lt;li&gt;tolower( )함수를 사용하면 변수들을 전부 소문자로 나타낼 수 있음&lt;/li&gt;
&lt;li&gt;toupper( )함수를 사용하면 변수들을 전부 대문자로 나타낼 수 있음&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/0Oh4a/btqSxBobr93/aLwfEZYKA00gEkDnbrdDe0/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/0Oh4a/btqSxBobr93/aLwfEZYKA00gEkDnbrdDe0/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/0Oh4a/btqSxBobr93/aLwfEZYKA00gEkDnbrdDe0/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2F0Oh4a%2FbtqSxBobr93%2FaLwfEZYKA00gEkDnbrdDe0%2Fimg.png&quot; data-origin-width=&quot;0&quot; data-origin-height=&quot;0&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;</description>
      <category>자격증/ADsP</category>
      <author>IT개미 데이터</author>
      <guid isPermaLink="true">https://2030bigdata.tistory.com/252</guid>
      <comments>https://2030bigdata.tistory.com/252#entry252comment</comments>
      <pubDate>Thu, 11 Feb 2021 17:17:30 +0900</pubDate>
    </item>
    <item>
      <title>[개미의 걸음 scikit-learn 4차시] Classification① 회귀분석 - 선형(with iris 데이터)</title>
      <link>https://2030bigdata.tistory.com/187</link>
      <description>&lt;h2 data-ke-size=&quot;size26&quot;&gt;들어가기전...&lt;/h2&gt;
&lt;p&gt;&lt;a href=&quot;https://2030bigdata.tistory.com/180&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot;&gt;2021/02/02 - [Python] - [개미의 걸음 scikit-learn 2차시] Classification(분류)의 이해&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;https://2030bigdata.tistory.com/186&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot;&gt;2021/02/03 - [Python] - [개미의 걸음 scikit-learn 3차시] Classification① 회귀분석&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h2 data-ke-size=&quot;size26&quot;&gt;선형회귀분석&lt;/h2&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;필요한 모듈 import&lt;/b&gt;&lt;/h4&gt;
&lt;blockquote data-ke-style=&quot;style3&quot;&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## pandas 모듈&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;import&lt;/b&gt;&lt;/span&gt; pandas &lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;as&lt;/b&gt;&lt;/span&gt; pd&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## iris 데이터 모듈&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;from&lt;/b&gt;&lt;/span&gt; sklearn.datasets &lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;import&lt;/b&gt;&lt;/span&gt; load_iris&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## train과 test set 구분 모듈&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;from&lt;/b&gt;&lt;/span&gt; sklearn.model_selection &lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;import&lt;/b&gt;&lt;/span&gt; train_test_split&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## 선형회귀분석 모듈&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;from&lt;/b&gt;&lt;/span&gt; sklearn.linear_model &lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;import&lt;/b&gt;&lt;/span&gt; LinearRegression&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## 데이터 표준화 모듈&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;from&lt;/b&gt;&lt;/span&gt; sklearn.preprocessing &lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;import&lt;/b&gt; &lt;/span&gt;StandardScaler&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## MSE(평균제곱오차)&amp;nbsp;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;from&lt;/b&gt;&lt;/span&gt; sklearn.metrics &lt;span style=&quot;color: #409d00;&quot;&gt;&lt;b&gt;import&lt;/b&gt;&lt;/span&gt; mean_squared_error&lt;br /&gt;&lt;br /&gt;## 정확도 예측 모듈(연속적인 데이터에서 사용 안함)&lt;br /&gt;## from sklearn.metrics import accuracy_score&amp;nbsp;&lt;/blockquote&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;데이터 셋 train/test 구분하기&lt;/b&gt;&lt;/h4&gt;
&lt;blockquote data-ke-style=&quot;style3&quot;&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## train, test 데이터를 각각 8:2로 구분&lt;/span&gt;&lt;br /&gt;x_train, x_test, y_train, y_test = train_test_split(iris_data, iris_label, test_size=0.2, random_state=1)&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## 데이터 표준화&lt;/span&gt;&lt;br /&gt;sc = StandardScaler()&lt;br /&gt;sc.fit(x_train)&lt;br /&gt;x_train_std = sc.transform(x_train)&lt;br /&gt;x_test_std = sc.transform(x_test)&lt;/blockquote&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;test_size는 0~1사이의 값을 가지며 전체 데이터(1)에서 test 데이터의 비중을 의미&lt;br /&gt;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;rarr; 기본값[default 값] : 0.25&lt;/li&gt;
&lt;li&gt;random_state는 숫자를 임의로 생성할 때 재현가능하도록 난수의 초기값을 입력 [난수 생성기]&lt;br /&gt;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;rarr; 기본값은 numpy.random에서 제공하는 random number generator가 사용됨&lt;br /&gt;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;rarr; random_state에 지정하는 정수값에 따라 분석 결과가 다르게 나옴&lt;br /&gt;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;rarr; 생략할 경우, 실행할 때마다 다른 결과가 나옴 [test/train 데이터가 계속 달라지므로]&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;rarr; 값을 지정할 경우, 여러번 다시 실행하여도 동일한 결과가 나옴&lt;br /&gt;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;rarr; 쉽게 말해서 재현 가능하도록 고정되는 숫자를 지정하는 것!!!&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;ex&amp;gt; random_state=3&amp;nbsp; &amp;nbsp;: 3개의 숫자는 무조건 고정&lt;br /&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; 3개를 뽑으면 항상 같은 수가 나오지만 5개를 뽑으면 3개만 같고 2개를 계속 변화&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;linear model 만들기&lt;/b&gt;&lt;/h4&gt;
&lt;blockquote data-ke-style=&quot;style3&quot;&gt;linear_model = LinearRegression()&lt;br /&gt;linear_model.fit(x_train_std, y_train)&lt;/blockquote&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;coefficent(기울기), intercept(절편) 구하기&lt;/b&gt;&lt;/h4&gt;
&lt;blockquote data-ke-style=&quot;style3&quot;&gt;print('linear_model.coef : ' , linear_model.coef_ , 'linear_model.intercept : ' , linear_model.intercept_)&lt;/blockquote&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;예측 데이터 만들기&lt;/b&gt;&lt;/h4&gt;
&lt;blockquote data-ke-style=&quot;style3&quot;&gt;y_pred = linear_model.predict(x_test_std)&lt;/blockquote&gt;
&lt;p data-ke-size=&quot;size18&quot;&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;MSE(잔차) 구하기&lt;/b&gt;[&lt;span style=&quot;color: #ee2323;&quot;&gt;&lt;b&gt;작을수록 모델의 예측력이 높음!!&lt;/b&gt;&lt;/span&gt;]&lt;/h4&gt;
&lt;blockquote data-ke-style=&quot;style3&quot;&gt;mse=mean_squared_error(y_true = y_test, y_pred = y_pred)&lt;br /&gt;print('mse :', mse)&lt;/blockquote&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;상관계수 비교하기&lt;/b&gt;[&lt;span style=&quot;color: #ee2323;&quot;&gt;&lt;b&gt;클수록 모델의 예측력이 높음!!&lt;/b&gt;&lt;/span&gt;]&lt;/h4&gt;
&lt;blockquote data-ke-style=&quot;style3&quot;&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## numpy.ndarray 타입을 pandas.core.series.Series 타입으로 변경&lt;/span&gt;&lt;br /&gt;y_test = pd.Series(y_test)&lt;br /&gt;y_pred = pd.Series(y_pred)&lt;br /&gt;print( type(y_test), type(y_pred) )&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## y_test와 y_pred 상관계수 분석&lt;/span&gt;&lt;br /&gt;cor = y_test.corr(y_pred)&lt;br /&gt;cor&lt;/blockquote&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;+ 데이터 프레임으로 만들기&lt;/b&gt;&lt;/h4&gt;
&lt;blockquote data-ke-style=&quot;style3&quot;&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## pandas를 이용해 데이터 프레임 만들기&lt;/span&gt;&lt;br /&gt;df = pd.DataFrame({'y_pred':y_pred, 'y_test':y_test})&lt;br /&gt;df&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #006dd7;&quot;&gt;## 데이터 프레임 상관계수 분석&lt;/span&gt;&lt;br /&gt;cor = df['y_pred'].corr(df['y_test'])&lt;br /&gt;cor&lt;/blockquote&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;</description>
      <category>Python</category>
      <category>coef</category>
      <category>intercept</category>
      <category>Linear</category>
      <category>MSE</category>
      <category>regression</category>
      <category>sklearn</category>
      <category>사이킷런</category>
      <category>선형회귀</category>
      <category>잔차</category>
      <author>IT개미 데이터</author>
      <guid isPermaLink="true">https://2030bigdata.tistory.com/187</guid>
      <comments>https://2030bigdata.tistory.com/187#entry187comment</comments>
      <pubDate>Thu, 11 Feb 2021 07:07:49 +0900</pubDate>
    </item>
    <item>
      <title>[개미의 걸음 ADsP 3과목] 데이터 마트의 이해(With 요약변수, 파생변수)</title>
      <link>https://2030bigdata.tistory.com/251</link>
      <description>&lt;h2 data-ke-size=&quot;size26&quot;&gt;&lt;b&gt;데이터마트[Data Mart]&lt;/b&gt;&lt;/h2&gt;
&lt;p&gt;데이터 웨어하우스와 사용자 사이의 중간층에 위치한 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;데이터 마트 내 대부분의 데이터는 데이터 웨어하우스로부터 복제되지만 자체적으로 수집도 가능&lt;/li&gt;
&lt;li&gt;관계형 데이터베이스나 다차원 데이터베이스를 이용해 구축&lt;/li&gt;
&lt;li&gt;동일한 데이터 셋을 활용할 경우, 최신 분석기법들을 이용하면 분석가의 역량 차이에 의한 분석 효과는 미미하지만 데이터 마트를 어떻게 구축하느냐에 따른 분속효과 차이는 큼&lt;/li&gt;
&lt;li&gt;CRM[Customer Relationship Management] 관련 업무 중에서 핵심은 고객 데이터 마트 구축!&lt;/li&gt;
&lt;li&gt;데이터 마트 내 대부분의 데이터는 데이터웨어하우스로부터 받음!&lt;br /&gt;&amp;nbsp; &amp;nbsp; &lt;span style=&quot;color: #333333;&quot;&gt;&amp;rarr; 받아온 데이터를 데이터 분석에 활용할 수 있는 자료로 변환하기 위해 만드는 것이 &quot;변수&quot;&lt;/span&gt;&lt;/li&gt;
&lt;li&gt;&lt;span style=&quot;color: #333333;&quot;&gt;변수에는 요약변수와 파생변수가 있음&lt;br /&gt;&lt;/span&gt;&lt;span style=&quot;letter-spacing: 0px;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;rarr; 요&lt;/span&gt;&lt;span style=&quot;letter-spacing: 0px;&quot;&gt;약변수와 파생변수를 생성하는 것은 데이터마트를 구성할 때 가장 중요한 부분 중 하나&lt;br /&gt;&lt;/span&gt;&amp;nbsp; &amp;nbsp; &amp;rarr; 모형 개발시 문제를 가장 잘 해석할 수 있는 변수를 찾는 것은 모형 개발에서 가장 중요한 핵심단계&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&lt;b&gt;요약변수&lt;/b&gt;&lt;/h3&gt;
&lt;p&gt;수집된 데이터를 특정 기준에 따라 사칙연산을 통해 만들어낸 변수&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;데이터 분석을 위해 만들어지는 데이터 마트의 가장 기본적인 변수&lt;/li&gt;
&lt;li&gt;많은 모델에 공통으로 사용될 수 있어 재활용성이 높음&lt;/li&gt;
&lt;li&gt;합계, 횟수 등과 같이 간단한 구조를 가지므로 자동화하여 상황에 맞게 또는 일반적인 자동화 프로그램 구축 가능&lt;/li&gt;
&lt;li&gt;요약변수의 단점은 얼마 이상이면 구매하더라도 기준값의 의미해석이 애매할 수 있음&lt;br /&gt;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;rarr; 이 경우, 연속형 변수를 그룹핑해 사용하는 것이 좋음&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h3 data-ke-size=&quot;size23&quot;&gt;&lt;b&gt;파생변수&lt;/b&gt;&lt;/h3&gt;
&lt;p&gt;사용자(분석자)의 노하우를 기반으로 특정 조건을 만족하거나 특정 함수에 의해 값을 만들어 의미를 부여한 변수&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;주관적인 변수이므로 논리적 타당성을 갖추어 개발하는 것이 중요&lt;/li&gt;
&lt;li&gt;상황에 따라 특정 상황에만 유의미하지 않게 대표성을 나타내는 것이 중요&lt;/li&gt;
&lt;li&gt;세분화, 고객행동 예측, 캠페인 반응 예측 등에서 많이 사용됨&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;</description>
      <category>자격증/ADsP</category>
      <category>ADsP</category>
      <category>Data Mart</category>
      <category>데이터마트</category>
      <category>변수</category>
      <category>요약변수</category>
      <category>파생변수</category>
      <author>IT개미 데이터</author>
      <guid isPermaLink="true">https://2030bigdata.tistory.com/251</guid>
      <comments>https://2030bigdata.tistory.com/251#entry251comment</comments>
      <pubDate>Wed, 10 Feb 2021 17:17:59 +0900</pubDate>
    </item>
    <item>
      <title>[개미의 걸음 scikit-learn 10차시] 회귀분석</title>
      <link>https://2030bigdata.tistory.com/186</link>
      <description>&lt;h2 data-ke-size=&quot;size26&quot;&gt;회귀분석&lt;/h2&gt;
&lt;p&gt;하나의 종속변수 y와 두 개 이상의 독립변수(x&lt;sub&gt;1&lt;/sub&gt;,x&lt;sub&gt;2&lt;/sub&gt;....)사이의 관계를 최소 제곱법에 의해 추정하는 수법&lt;/p&gt;
&lt;table style=&quot;border-collapse: collapse; width: 100%;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 17.4419%;&quot;&gt;선형회귀&lt;/td&gt;
&lt;td style=&quot;width: 82.5581%;&quot;&gt;관측값 y&lt;sub&gt;1&lt;/sub&gt;이 독립변수의 선형 조합으로 표현되는 것&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 17.4419%;&quot;&gt;비선형회귀&lt;/td&gt;
&lt;td style=&quot;width: 82.5581%;&quot;&gt;관측값 y&lt;sub&gt;1&lt;/sub&gt;이 독립변수의 곡선 조합으로 표현되는 것&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;회귀식&lt;/b&gt;&lt;/h4&gt;
&lt;p&gt;데이터들을 대표하는 선을 그리는 것&lt;/p&gt;
&lt;ul style=&quot;list-style-type: disc;&quot; data-ke-list-type=&quot;disc&quot;&gt;
&lt;li&gt;Y=WX + b&amp;nbsp; [W : 가중치, b : 편향(bias)]&lt;br /&gt;&amp;nbsp; &amp;nbsp; ex&amp;gt; Y = W&lt;sub&gt;0&lt;/sub&gt;+W&lt;sub&gt;1&lt;/sub&gt;X&lt;sub&gt;1&lt;/sub&gt;+W&lt;sub&gt;2&lt;/sub&gt;X&lt;sub&gt;2&lt;/sub&gt;&lt;/li&gt;
&lt;li&gt;점과 회귀식에 의해 그어진 점 사이의 거리가 에러&lt;br /&gt;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;rarr; erroer=y - ŷ [y: 실제값,&amp;nbsp; ŷ: 예측값]&lt;/li&gt;
&lt;li&gt;다양한 데이터를 분류하기 위해선 cost를 최소화할 수 있는 다양한 선을 그어야 함[Decision Boundary]&lt;br /&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;제목 없음.png&quot; data-origin-width=&quot;203&quot; data-origin-height=&quot;34&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/bVfdwV/btqHQHEehgl/Kr1Tjok7zuL8iKr1i0S3zk/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/bVfdwV/btqHQHEehgl/Kr1Tjok7zuL8iKr1i0S3zk/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/bVfdwV/btqHQHEehgl/Kr1Tjok7zuL8iKr1i0S3zk/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbVfdwV%2FbtqHQHEehgl%2FKr1Tjok7zuL8iKr1i0S3zk%2Fimg.png&quot; data-filename=&quot;제목 없음.png&quot; data-origin-width=&quot;203&quot; data-origin-height=&quot;34&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4 data-ke-size=&quot;size20&quot;&gt;&lt;b&gt;선형회귀 vs 로지스틱 회귀&lt;/b&gt;&lt;/h4&gt;
&lt;table style=&quot;border-collapse: collapse; width: 100%;&quot; border=&quot;1&quot;&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.4961%;&quot;&gt;&amp;nbsp;&lt;/td&gt;
&lt;td style=&quot;width: 38.4495%; text-align: center;&quot;&gt;&lt;b&gt;선형 회귀&lt;/b&gt;&lt;/td&gt;
&lt;td style=&quot;width: 42.0543%; text-align: center;&quot;&gt;&lt;b&gt;로지스틱 회귀&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.4961%; text-align: center;&quot;&gt;확률값 해석 가능여부&lt;/td&gt;
&lt;td style=&quot;width: 38.4495%; text-align: center;&quot;&gt;확률값으로 직접 해석 불가&lt;/td&gt;
&lt;td style=&quot;width: 42.0543%; text-align: center;&quot;&gt;확률값으로 해석 가능&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.4961%; text-align: center;&quot;&gt;종속 변수&lt;/td&gt;
&lt;td style=&quot;width: 38.4495%; text-align: center;&quot;&gt;연속형 변수&lt;/td&gt;
&lt;td style=&quot;width: 42.0543%; text-align: center;&quot;&gt;(0,1) &lt;span style=&quot;color: #333333;&quot;&gt;&amp;rarr;&lt;span&gt; 범주형 데이터&lt;/span&gt;&lt;/span&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.4961%; text-align: center;&quot;&gt;계수 추정법&lt;/td&gt;
&lt;td style=&quot;width: 38.4495%; text-align: center;&quot;&gt;최소 제곱법&lt;/td&gt;
&lt;td style=&quot;width: 42.0543%; text-align: center;&quot;&gt;최대 우도 추정법&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.4961%; text-align: center;&quot;&gt;모형 검정&lt;/td&gt;
&lt;td style=&quot;width: 38.4495%; text-align: center;&quot;&gt;F검정, T검정&lt;/td&gt;
&lt;td style=&quot;width: 42.0543%; text-align: center;&quot;&gt;카이제곱검정[x&lt;sup&gt;2&lt;/sup&gt;-test]&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.4961%; text-align: center;&quot;&gt;가설함수&lt;/td&gt;
&lt;td style=&quot;width: 38.4495%; text-align: center;&quot;&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;1.png&quot; data-origin-width=&quot;121&quot; data-origin-height=&quot;26&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/C1MIV/btqHGTMH0tP/HaY7KjahsRubahXPsDSWfK/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/C1MIV/btqHGTMH0tP/HaY7KjahsRubahXPsDSWfK/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/C1MIV/btqHGTMH0tP/HaY7KjahsRubahXPsDSWfK/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FC1MIV%2FbtqHGTMH0tP%2FHaY7KjahsRubahXPsDSWfK%2Fimg.png&quot; data-filename=&quot;1.png&quot; data-origin-width=&quot;121&quot; data-origin-height=&quot;26&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/td&gt;
&lt;td style=&quot;width: 42.0543%; text-align: center;&quot;&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;2.png&quot; data-origin-width=&quot;136&quot; data-origin-height=&quot;37&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/co9662/btqHLfhqGbb/YybgxDTYK7oqEjNMxElJuK/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/co9662/btqHLfhqGbb/YybgxDTYK7oqEjNMxElJuK/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/co9662/btqHLfhqGbb/YybgxDTYK7oqEjNMxElJuK/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fco9662%2FbtqHLfhqGbb%2FYybgxDTYK7oqEjNMxElJuK%2Fimg.png&quot; data-filename=&quot;2.png&quot; data-origin-width=&quot;136&quot; data-origin-height=&quot;37&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.4961%; text-align: center;&quot;&gt;비용함수&lt;/td&gt;
&lt;td style=&quot;width: 38.4495%; text-align: center;&quot;&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;3.png&quot; data-origin-width=&quot;251&quot; data-origin-height=&quot;31&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/deMz5L/btqHLX8RZMo/uB2tdPMcUsMA38oBgp5LLK/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/deMz5L/btqHLX8RZMo/uB2tdPMcUsMA38oBgp5LLK/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/deMz5L/btqHLX8RZMo/uB2tdPMcUsMA38oBgp5LLK/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FdeMz5L%2FbtqHLX8RZMo%2FuB2tdPMcUsMA38oBgp5LLK%2Fimg.png&quot; data-filename=&quot;3.png&quot; data-origin-width=&quot;251&quot; data-origin-height=&quot;31&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/td&gt;
&lt;td style=&quot;width: 42.0543%; text-align: center;&quot;&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;4.png&quot; data-origin-width=&quot;475&quot; data-origin-height=&quot;39&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/vhsay/btqHCUTcsxt/35l6Lt3BitpwN1bVKazfF0/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/vhsay/btqHCUTcsxt/35l6Lt3BitpwN1bVKazfF0/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/vhsay/btqHCUTcsxt/35l6Lt3BitpwN1bVKazfF0/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fvhsay%2FbtqHCUTcsxt%2F35l6Lt3BitpwN1bVKazfF0%2Fimg.png&quot; data-filename=&quot;4.png&quot; data-origin-width=&quot;475&quot; data-origin-height=&quot;39&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style=&quot;width: 19.4961%; text-align: center;&quot;&gt;기울기함수[미분]&lt;/td&gt;
&lt;td style=&quot;width: 38.4495%; text-align: center;&quot;&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;5.png&quot; data-origin-width=&quot;251&quot; data-origin-height=&quot;40&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/cGW9iW/btqHJjducsC/SHpfofjm6QvW3Q4GQ1Ppp0/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/cGW9iW/btqHJjducsC/SHpfofjm6QvW3Q4GQ1Ppp0/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/cGW9iW/btqHJjducsC/SHpfofjm6QvW3Q4GQ1Ppp0/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcGW9iW%2FbtqHJjducsC%2FSHpfofjm6QvW3Q4GQ1Ppp0%2Fimg.png&quot; data-filename=&quot;5.png&quot; data-origin-width=&quot;251&quot; data-origin-height=&quot;40&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/td&gt;
&lt;td style=&quot;width: 42.0543%; text-align: center;&quot;&gt;&lt;figure class=&quot;imageblock alignCenter&quot; data-filename=&quot;5.png&quot; data-origin-width=&quot;251&quot; data-origin-height=&quot;40&quot; data-ke-mobilestyle=&quot;widthContent&quot;&gt;&lt;span data-url=&quot;https://blog.kakaocdn.net/dn/cjyCPD/btqHA3ii450/P9I87MEhTRWIBHOVswHf01/img.png&quot; data-phocus=&quot;https://blog.kakaocdn.net/dn/cjyCPD/btqHA3ii450/P9I87MEhTRWIBHOVswHf01/img.png&quot;&gt;&lt;img src=&quot;https://blog.kakaocdn.net/dn/cjyCPD/btqHA3ii450/P9I87MEhTRWIBHOVswHf01/img.png&quot; srcset=&quot;https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&amp;fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcjyCPD%2FbtqHA3ii450%2FP9I87MEhTRWIBHOVswHf01%2Fimg.png&quot; data-filename=&quot;5.png&quot; data-origin-width=&quot;251&quot; data-origin-height=&quot;40&quot; data-ke-mobilestyle=&quot;widthContent&quot; onerror=&quot;this.onerror=null; this.src='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png'; this.srcset='//t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png';&quot;/&gt;&lt;/span&gt;&lt;/figure&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;</description>
      <category>Python</category>
      <author>IT개미 데이터</author>
      <guid isPermaLink="true">https://2030bigdata.tistory.com/186</guid>
      <comments>https://2030bigdata.tistory.com/186#entry186comment</comments>
      <pubDate>Wed, 10 Feb 2021 07:07:16 +0900</pubDate>
    </item>
  </channel>
</rss>