오늘의 인기 글
최근 글
최근 댓글
Today
Total
01-02 02:44
관리 메뉴

우노

[R] 실험계획법(DOE,design of experiments)이란? 본문

Language/R

[R] 실험계획법(DOE,design of experiments)이란?

운호(Noah) 2020. 10. 16. 20:28

실험계획법(DOE, design of experiments)이란?

  • 문제 해결을 위해 실험을 계획 하는 방법으로, 최소의 실험 횟수에서 최대의 정보를 얻을 수 있도록 계획하는 것이다.
    • 특성치 (Characteristic value)
      • 실험을 통해 얻어지는 모든 결과치(종속변수 Y)를 의미한다.
    • 인자 (Factor)
      • 실험에 사용되는 원인(독립변수 X)를 의미한다.
      • 인자는 정량적일 뿐만아니라 정성적 데이터로 표현할 수 있다.
        • 예를 들면 온도나 시간은 정량적 데이터로 표현되지만
        • 청결함이나 사람의 심리상태 같은 부분은 정성적 데이터로 표현되기도 한다.
    • 수준 (Level)
      • 실험에서 '인자의 정도나 값' 을 의미한다.
        • 예를 들면 온도와 같은 정량적인 인자의 경우에는
        • 모든 온도 값이, 온도라는 인자의 수준으로 볼 수 있다.

DOE(실험계획법)의 구체적인 목적

  • 1) 어떤 요인이 특성치 변화에 유의한 영향을 주고 있는가를 파악하고, 그 영향이 양적으로 어느 정도인지 알아내기 위해
  • 2) 어떤 인자 수준에서 가장 목표 값에 근사한 특성치를 얻을 수 있는가를 파악하기 위해
  • 3) 취급한 인자들로는 설명이 안되는 오차와 그 변동이 어느 정도인지 파악하기 위해

DOE(실험계획법) 절차

  • 1) 실험 목적 설정
    • 실험을 통하여 얻고자 하는 바를 명확히 설정한다.
    • 목적이 불명확하면 결과 분석이 어렵게 된다.
  • 2) 특성치 선택
    • 종속 변수 Y
    • 실험 목적 달성과 관련된 실험 결과치를 특성치로 선정한다.
    • 무엇을 어떻게 어느 수준까지 측정할 것인가
  • 3) 인자(Factor)와 수준(Level) 선택
    • 독립변수 X
    • 실험 목적 달성과 관련된 인자는 모두 선택하는 것이 원칙이나 인자수가 많으면 실험회수가 증가한다.
    • 따라서 목적 달성이 가능한 범위 내에서 최소 인자적절한 수준을 선택한다.
  • 4) 실험점 배치 및 실시
    • 인자, 수준, 실험 가능 횟수 등을 고려해 샘플링 기법을 선정하고 실험점 배치 후 실시한다.
  • 5) 산출된 결과 분석
    • 영향도 평가
      • 인자 및 특성치 간 서로 영향을 주는지 파악하고 그 경향을 알아낸다.
    • 주요 인자 식별
      • 특성치에 영향을 주는 인자를 파악하고 어느 정도 크기인지 확인한다.
    • 메타 모델 생성
      • 인자들과 특성치 간의 관계를 근사하는 대체 모델을 생성한다.
    • 설계 해 도출
      • 가장 바람직한 특성치를 얻을 수 있는 영향 인자들의 값을 찾아낸다.

DOE 기본 원리

  • 1) 랜덤화 (Randomization)
    • 실험 순서를 무작위로 결정하는 것을 랜덤화라고 한다.
    • 선택된 인자 외의 기타 원인들이 실험에 영향을 주는것에 대해 방지하기 위해 사용된다.
  • 2) 반복 (Replication)
    • 인자의 동일한 수준 내에서 실험을 최소 두 번 이상 수행한다.
      • 통제 불가능한 요인에 의해 실험결과가 매 시행마다 달라질 가능성이 있기 때문
      • 반복 실험을 통해 실험 간의 오차 추정이 가능하고, 이는 관측된 인자의 효과가 통계적으로 유의미한지 판단하게 해줌
  • 3) 블록화 (Blocking)
    • 전체 실험에서 동일한 조건을 가진 여러가지 경우들로 나누는 것을 블록화라고 한다.
    • 이 때, 각 블록 내에서의 인자들의 효과를 관찰한다.
    • 만일 블록화가 하기 어려운 경우에는 랜덤화가 차선책으로 많이 쓰인다.

DOE의 종류

  • 요인배치법 (Factorial design)

    • 인자들의 모든 수준 조합에 대해서 실험을 하는 방법이다.
    • 예를 들어, 위 그림처럼 3개의 인자가 있고 각 인자마다 2개의 수준이 있다면
    • 총 실험 횟수는 2^3 = 2x2x2=8회가 된다.
    • 인자의 개수에 따라 일원배치법, 이원배치법, 다원배치법 등으로 분류할 수 있다.
    • 하지만, Factorial Design에서 인자는 2가지의 수준 값만 가질 수 있다.
  • 분할법 (Split-plot design)

    • 요인배치법 중, 실험 순서를 완전히 무작위로 하지 않고 몇 단계로 나누어 순서를 무작위화 하는 실험 계획법이다.
    • 주로 실험에 취급되는 인자가 완전 랜덤화 하기 어려운 인자일 경우에 사용된다.
  • 교락법 (Confounding method)

    • 실험을 능률적으로 하기 위해 교락(두 개 이상의 요인 효과가 혼합되어 분리할 수 없는 것)을 적극적으로 도입하는 방법이다.
    • 교락을 시키는 이유는 불필요한 효과를 최대한 배제하기 위해서이다.
    • 불필요한 효과를 교락시켜 필요한 효과만을 최대한 적은 횟수의 실험으로 구하기 위해 적극적으로 교락을 도입하는 실험 계획법을 교락법이라 한다.
  • Response Surface Modelling (RSM)

    • 2가지 이상의 수준을 가지고 있는 여러 인자와 하나 이상의 특성치 간의 관계를 탐색합니다.
    • Response Surface Modelling (RSM)을 구하는 효율적인 실험계획법으로는
    • Central Composite Design, Box-Behnken Design, D-Optimal Design 등이 있다.
  • D-optimal Design

    • 각각의 인자가 2가지 이상의 수준을 가지고 있거나
    • 인자의 수준이 규칙적이지 않을 때
    • 전체 데이터셋에서 중요한 데이터만 가져와 효율적으로 실험하기 위해 쓰이는 실험계획법이다.
    • 데이터 행렬은 X로 표현되며
    • 정보행렬인 |X’X(대각행렬)|최대화하여 추정 된 회귀 계수의 전체 분산을 최소화하도록 구성된다.
    • 자세한 설명 및 예제 코드

'Language > R' 카테고리의 다른 글

[R] reached getOption("max.print") 오류 해결 방법  (2) 2021.02.04
[R] dataframe slice 하는 방법  (0) 2021.01.08
[R] 파일 입출력  (0) 2020.12.04
[R] 작업 폴더 경로 변경  (0) 2020.12.04
[R] D-optimal이란?  (2) 2020.10.16
Comments