INPIXON
시그마플롯 제품 특징
시그마플롯의 새로운 기능 및 개선 사항
- 숲 플롯
- 커널 밀도 플롯
- 10가지 새로운 색상 구성표
- 평균 및 표준 오차 막대가 있는 도트 밀도 그래프
- 범례 개선 사항
- 가로, 세로 및 직사각형 범례 모양
- 커서를 측면 또는 위쪽 또는 아래쪽 핸들에 놓습니다.
-
-
- 다중 열 범례 허용
-
- 속성 대화 상자에서 범례 항목 열의 개수를 설정하는 사용자 인터페이스입니다. 허용되는 열 번호는 콤보 목록에 표시됩니다.
- 경계 상자에서 가운데 핸들을 선택하고 끌어서 범례 항목 열의 수를 변경합니다.
- 범례 항목 재정렬
- 속성 대화 상자를 통해 – 목록 상자 상단의 위/아래 컨트롤을 사용하여 하나 또는 여러 범례 항목을 위/아래로 이동합니다.
- 커서 이동을 통해 – 하나 또는 여러 범례 항목을 위아래로 이동합니다. 범례 항목을 선택하고 키보드 위쪽 및 아래쪽 화살표 키를 사용하여 경계 상자 내에서 이동합니다.
- 경계 상자의 항목에 대한 마우스 선택 및 커서 이동을 통해
- 개별 범례 항목 속성 설정 – 개별 범례 항목을 선택하고 미니 도구 모음을 사용하여 속성을 변경합니다.
- 커서를 통한 범례 상자 빈 영역 제어
- 모서리 핸들 위로 커서 이동
- 비례 크기 조정 가능
- 간단한 직접 라벨링 추가
- 속성 대화 상자에서 “직접 레이블 지정” 확인란 컨트롤을 사용하여 “직접 레이블 지정” 지원
- 범례 항목 그룹 해제 – 개별 범례 항목을 원하는 위치로 이동하고 그래프와 함께 이동할 수 있습니다.
- 범례 제목 지원이 추가되었습니다(기본적으로 제목 없음). 사용자는 범례 속성 패널을 사용하여 범례 상자에 제목을 추가할 수 있습니다.
- 오른쪽 클릭 컨텍스트 메뉴를 사용하여 범례 항목 반전하기
- 범례 단색 또는 범례 텍스트를 두 번 클릭하여 범례 속성을 엽니다.
- 범례에 재설정이 추가되어 범례 옵션을 기본값으로 초기화할 수 있습니다.
- 가로, 세로 및 직사각형 범례 모양
새로운 분석 기능
- 주성분 분석(PCA)
- 공분산 분석(ANCOVA)
- 비모수적 분산 분석에 대한 다중 비교에 P값을 추가했습니다.
- 다중 비교 유의 수준에 대한 콤보 상자 선택 항목을 제거하고 다중 비교의 유의 수준을 주(옴니버스) 테스트에 묶었습니다.
- 회귀 마법사 및 동적 맞춤 마법사 보고서와 보고서 옵션 대화 상자에 Akaike 정보 기준이 추가되었습니다.
- 시그마스탯 그룹에 재실행 버튼을 다시 추가했습니다.
- 핏 라이브러리 standard.jfl 업데이트
- 커브 피팅 또는 함수 시각화를 위한 확률 함수가 추가되어 현재 24개가 포함됩니다.
- 모든 방정식의 허용 오차 값이 고정 소수점 대신 ‘전자 표기법’을 사용하도록 수정되었습니다. 이렇게 하면 사용자가 스크롤하지 않고도 값을 읽을 수 있습니다.
- standard.jfl의 모든 커브 맞춤 방정식에 7개의 가중치 함수를 추가합니다. 3D 방정식에는 약간의 변형이 추가되었습니다.
새로운 사용자 인터페이스 기능
- 섹션에서 노트북 항목을 드래그해 재정렬합니다.
- 새로운 시그마플롯 튜토리얼 PDF 파일
- 워크시트 열의 선 너비
새로운 가져오기/내보내기 기능
- 확장 가능한 벡터 그래픽 내보내기를 위한 SVG 및 SWF 파일 형식이 추가되었습니다.
- 기존 래스터 PDF를 개선하기 위해 벡터 PDF 내보내기가 추가되었습니다.
- Minitab 버전 13 및 14, SAS 버전 9, SPSS 버전 19, Symphony 버전 13에 파일 가져오기 및 내보내기 지원이 추가되었습니다.
시그마플롯 제품 특징
숲 플롯
포레스트 플롯은 동일한 질문을 다루는 여러 분석을 결합하는 데 사용되는 '메타 분석'의 한 형태입니다. 메타분석은 각 기여 연구의 샘플을 통계적으로 결합하여 개별 연구의 효과 크기보다 더 정확한 전체 요약 통계를 생성합니다. 개별 연구 값과 95% 신뢰 구간은 가로 오차 막대가 있는 사각형 기호로 표시되며, 전체 요약 통계는 95% 신뢰 구간과 동일한 너비의 다이아몬드로 표시됩니다.
커널 밀도
커널 밀도 기능은 기본 데이터 분포의 추정치를 생성합니다. 이는 계단형 히스토그램과 비교해야 합니다. 막대 그래프에 비해 장점(막대 없음)과 단점(개수 정보 손실)이 있으며, 히스토그램과 함께 사용해야 합니다. 동시에 생성할 수 있습니다.
평균 및 표준 오차 막대가 있는 도트 밀도
평균 + 표준 오차 막대 계산, 기호 + 오차 막대 계산이 도트 밀도 그래프에 추가되었습니다. 이렇게 하면 평균, 중앙값, 백분위수 및 박스 플롯과 같은 다른 도트 밀도 표시 통계가 향상됩니다.
새로운 색상 구성표
10가지 새로운 색 구성표가 구현되었습니다. 세 가지 예가 아래에 나와 있습니다:
범례 개선 사항 - 도형
이제 세로, 가로 및 직사각형 범례 모양을 사용할 수 있습니다.
범례 순서 바꾸기
이제 범례 항목 순서를 바꾸도록 선택할 수 있습니다. 이렇게 하면 일부 그래프 유형에 보다 논리적인 순서를 제공할 수 있습니다.
범례 항목 재정렬
범례 항목의 순서를 변경하는 방법은 세 가지가 있습니다. 여기에 표시된 것처럼 그래프 속성의 범례 패널에서 위쪽/아래쪽 화살표 컨트롤을 사용하여 하나 또는 여러 개의 범례 항목을 위아래로 이동할 수 있습니다. 범례에서 항목을 선택하고 키보드 위쪽 및 아래쪽 화살표 키를 사용하면 더욱 쉽게 사용할 수 있습니다. 또는 범례 항목을 선택하고 마우스 커서로 새 위치로 드래그합니다.
범례 항목의 미니 툴바 편집
이제 범례 항목을 클릭하고 미니 도구 모음을 사용하여 범례 항목을 편집할 수 있습니다.
직접 라벨링
이제 범례의 그룹을 해제하고 개별 범례 항목을 적절한 플롯에 인접하게 배치할 수 있습니다. 레이블은 그래프에 대한 위치를 유지하기 위해 그래프와 함께 움직입니다. 라벨이 플롯에 인접해 있으므로 이제 각 플롯을 시각적으로 훨씬 쉽게 식별할 수 있습니다.
주성분 분석(PCA)
주성분 분석(PCA)은 더 적은 수의 차원으로 데이터를 근사화하여 고차원 데이터의 복잡성을 줄이는 기법입니다. 각각의 새로운 차원을 주성분이라고 하며 원래 변수의 선형 조합을 나타냅니다. 첫 번째 주성분은 데이터의 변동을 가능한 한 많이 설명합니다. 이후의 각 주성분은 가능한 한 많은 나머지 변동을 설명하며 이전의 모든 주성분과 직교합니다.
주성분을 조사하여 데이터의 변동 원인을 파악할 수 있습니다. 예측 모델을 구성하는 데에도 사용할 수 있습니다. 데이터의 변동이 대부분 저차원 하위 집합에 존재하는 경우, 주성분으로 응답 변수를 모델링할 수 있습니다. 주성분을 사용하여 회귀, 클러스터링 및 기타 통계 기법에서 변수 수를 줄일 수 있습니다.
주성분을 조사하여 데이터의 변동 원인을 파악할 수 있습니다. 예측 모델을 구성하는 데에도 사용할 수 있습니다. 데이터의 변동이 대부분 저차원 하위 집합에 존재하는 경우, 주성분으로 응답 변수를 모델링할 수 있습니다. 주성분을 사용하여 회귀, 클러스터링 및 기타 통계 기법에서 변수 수를 줄일 수 있습니다.
그래픽 출력은 스크리, 컴포넌트 로딩 및 컴포넌트 스코어 플롯으로 구성됩니다.
공분산 분석(ANCOVA)
단일 요인 분산 분석 모델은 연구 대상자를 모집단에서 무작위로 샘플링한 다음 각 피험자를 여러 요인 수준 또는 치료법 중 하나에 무작위로 배정하여 각 피험자가 치료를 받을 확률이 동일하도록 하는 완전 무작위 설계를 기반으로 합니다. 이 설계의 일반적인 가정은 피험자가 동질적이라는 것입니다. 즉, 피험자 간 차이가 존재하는 다른 변수는 치료 효과를 크게 변화시키지 않으므로 모델에 포함할 필요가 없습니다. 그러나 조사자가 통제할 수 없는 변수가 하나 이상의 요인 그룹 내 관찰에 영향을 미치는 경우가 많으므로 다중 비교를 포함하여 그룹 평균, 오차, 변동성의 원인 및 그룹 효과의 P값을 조정해야 하는 경우가 종종 있습니다.
이러한 변수를 공변량이라고 합니다. 일반적으로 연속형 변수이지만 범주형 변수일 수도 있습니다. 이러한 요인은 일반적으로 연구에 부차적으로 중요하고 위에서 언급했듯이 연구자가 통제할 수 없기 때문에 추가적인 주효과 요인을 나타내지는 않지만 결과의 정확성을 높이기 위해 모델에 포함될 수 있습니다. 공변수는 성가신 변수 또는 수반되는 변수라고도 합니다.
공분산 분석(ANCOVA)은 모델에 하나 이상의 공변량을 추가 변수로 지정하여 얻은 공분산 분석의 확장입니다. 인덱싱된 데이터 형식을 사용하여 시그마플롯 워크시트에서 분산 분석 데이터를 정렬하면 분산 분석 설계에서와 같이 한 열은 요인을 나타내고 한 열은 종속 변수(관측치)를 나타냅니다. 또한 각 공변인에 대해 하나의 열을 갖게 됩니다. 공변수의 효과를 포함하는 모델을 사용하면 종속변수 값의 변동성을 더 많이 설명할 수 있습니다.
이렇게 하면 일반적으로 무작위 샘플링 변동성으로 인한 설명할 수 없는 분산이 줄어들어 공변량이 없는 동일한 모델(공분산 분석 모델)에 비해 공분산 분석의 민감도가 높아집니다. 테스트 민감도가 높을수록 표준 분산분석 모델에 비해 치료법 간의 평균 차이가 더 작아져 통계적 파워가 높아집니다.
공분산 분석 사용의 간단한 예로, 학생들을 세 가지 유형의 교수 방법 중 하나에 무작위로 배정하고 성취도 점수를 측정하는 실험을 생각해 보겠습니다. 목표는 다양한 방법의 효과를 측정하고 한 방법이 다른 방법보다 평균 점수가 현저히 높은지 확인하는 것입니다. 방법은 강의, 자기 주도 학습, 협동 학습이 있습니다. 이 가상의 데이터에 대해 일원 분산 분석을 수행하면 아래 표의 ANOVA 열 제목 아래에 결과가 표시됩니다. 교육 방법 간에는 큰 차이가 없다는 결론을 내렸습니다. 또한 관측값의 무작위 샘플링 변동성으로 인해 분산분석(ANOVA) 모델로 설명할 수 없는 분산이 35.17로 추정된다는 점에 유의하세요.
본 연구에 참여한 학생들은 이전 학업 성취도에 따라 한 가지 방법이 다른 방법보다 더 많은 혜택을 받을 수 있습니다. 주에서 승인한 표준 기반 평가(SBA)와 같은 일부 사전 능력을 측정하는 공변수를 포함하도록 연구를 세분화한다고 가정해 보겠습니다. 이 데이터에 대해 일원분산분석을 수행하면 아래 표의 ANCOVA 열 제목 아래에 결과가 표시됩니다.
각 방법에 대해 표에 표시된 조정된 평균은 공변수의 효과를 통제하기 위해 그룹 평균을 보정한 것입니다. 그 결과 조정된 평균은 강의 방식이 더 성공적일수록 유의미한 차이를 보였습니다. 평균의 표준 오차가 거의 3배 가까이 감소한 반면 무작위 표본 변동성으로 인한 분산은 10배 가까이 감소한 것을 확인할 수 있습니다. 공변량을 도입하고 공분산분석을 수행하면 오류가 감소하는 것이 일반적인 결과입니다.
그룹 내 회귀선, 잔차 산포도, 신뢰 구간을 포함한 조정 평균, 정규성 확률 그래프 등 네 가지 ANCOVA 결과 그래프가 있습니다:
비모수 분산 분석의 P 값
시그마플롯의 비모수적 분산 분석(비모수적 분산 분석) 테스트는 Kruskal-Wallis 테스트(순위에 대한 일방향 분산 분석)와 Friedman 테스트(순위에 대한 일방향 반복 측정 분산 분석)입니다. 이 두 가지 모두 치료 요인에서 유의미한 효과의 원인을 파악하기 위한 네 가지 사후 테스트 절차를 제공합니다. 네 가지 절차는 투키, SNK, 던스, 던넷입니다.
처음 세 가지 절차는 치료 그룹 간의 각 쌍별 비교의 유의성을 테스트하는 데 사용할 수 있으며, 마지막 두 절차는 대조군과의 비교의 유의성을 테스트하는 데 사용할 수 있습니다. 던의 방법은 치료 그룹의 표본 크기가 같지 않은 경우에 사용할 수 있는 유일한 절차입니다.
사후 테스트 절차가 사용된 경우, 보고서에는 처리 수준을 쌍으로 비교한 결과가 나열된 표가 제공됩니다. 표의 마지막 열에는 순위의 차이가 유의미한지 여부가 표시됩니다. 이전 버전의 시그마플롯에서는 유의성을 판단하기 위해 분산분석의 유의 수준(보통 .05)과 비교할 수 있는 조정된 p값이 제공되지 않습니다.
이는 시그마플롯이 각 비교에 대해 계산된 관찰된 검정 통계를 조회 테이블에서 얻은 통계 분포의 임계값과 비교하여 유의성을 결정했기 때문입니다. 시그마플롯에는 네 가지 사후 방법에 해당하는 확률 분포에 대한 두 세트의 룩업 테이블이 있는데, 한 세트는 유의 수준 .05, 다른 세트는 유의 수준 .01에 대한 것입니다.
최근 분석 절차를 사용하여 이러한 분포의 p값을 계산하도록 변경되어 조회 테이블이 더 이상 사용되지 않게 되었습니다. 이 변경 사항으로 인해 이제 각 쌍별 비교에 대해 조정된 p값을 보고할 수 있게 되었습니다. 또한 이 변경으로 다중 비교 시 .05 및 .01을 유일한 유의 수준으로 사용해야 한다는 제한을 없앨 수 있게 되었습니다. 따라서 사용자는 0에서 1 사이의 유효한 P값 유의 수준을 입력할 수 있습니다.
AICc(아카이브 정보 기준)
카이제 정보 기준(AIC)은 주어진 데이터 세트에 회귀 모델을 맞출 때 상대적인 성능을 측정하는 방법을 제공합니다. 정보 엔트로피의 개념에 기반한 이 기준은 데이터를 설명하기 위해 모델을 사용할 때 손실되는 정보의 상대적인 척도를 제공합니다. 더 구체적으로 말하면, 추정 모델의 가능성을 최대화하는 것(데이터가 정규 분포인 경우 잔차 제곱의 합을 최소화하는 것과 동일)과 모델의 자유 변수 수를 최소로 유지하여 복잡성을 줄이는 것 사이에서 절충점을 찾습니다. 적합도는 매개변수를 추가하면 거의 항상 향상되지만, 과적합은 입력 데이터의 변화에 대한 모델의 민감도를 증가시켜 예측 기능을 망칠 수 있습니다.
AIC를 사용하는 기본적인 이유는 모델 선택을 위한 가이드입니다. 실제로는 후보 모델 세트와 주어진 데이터 세트에 대해 계산됩니다. AIC 값이 가장 작은 모델이 집합에서 "진정한" 모델을 가장 잘 나타내는 모델, 즉 AIC가 추정하도록 설계된 정보 손실을 최소화하는 모델로 선택됩니다. AIC가 최소인 모델을 결정한 후에는 다른 후보 모델 각각에 대해 상대적 가능성을 계산하여 AIC가 최소인 모델에 비해 정보 손실을 줄일 수 있는 확률을 측정할 수도 있습니다. 상대적 가능성은 조사자가 추가 검토를 위해 세트에 있는 두 개 이상의 모델을 유지해야 하는지 여부를 결정하는 데 도움이 될 수 있습니다.
AIC 계산은 다음과 같은 일반적인 공식을 기반으로 합니다.
여기서은 회귀 문제에서 추정 가능한 매개변수의 수로, 모델 매개변수와 미지의 관측 분산을 포함하며, 은 추정된 모델에 대한 확률 함수의 최대값입니다.
데이터의 표본 크기 가 매개변수 수 에 비해 작을 경우(일부 저자는 가 보다 몇 배 이상 크지 않을 때라고 말합니다.) 과적합을 방지하기 위해 AIC 가 잘 작동하지 않습니다. 이 경우 다음과 같이 수정된 버전의 AIC가 제공됩니다.
추가 매개변수가 있는 경우 AICc가 AIC보다 더 큰 페널티를 부과하는 것을 알 수 있습니다. 대부분의 저자는 모든 상황에서 AIC 대신 AICc를 사용해야 한다는 데 동의하는 것 같고, 시그마플롯에서 구현된 것이 바로 AICc입니다. 그래프의 비대칭 방정식은 AICc 값이 대칭 방정식보다 7단위 이상 작기 때문에 대칭 방정식보다 훨씬 낫습니다(AICc의 경험 법칙). 차이가 2보다 크면 AICc 값이 작은 방정식을 최적 방정식으로 간주하지 말고 최적 방정식의 후보로 고려해야 합니다.
비선형 회귀 확률 함수
24개의 새로운 확률 맞춤 함수가 맞춤 라이브러리 standard.jfl에 추가되었습니다. 이러한 함수와 일부 방정식 및 그래프 모양은 아래에 나와 있습니다.
비선형 회귀 가중치 함수
이제 각 비선형 회귀 방정식에는 7가지 가중치 함수가 내장되어 있습니다(3D는 약간 다릅니다). 이러한 함수는 역수 y, 역수 y 제곱, 역수 x, 역수 x 제곱, 역수 예측, 역수 예측 제곱 및 코시(Cauchy) 함수입니다. 반복적으로 가중치를 재조정하는 최소제곱 알고리즘을 사용하여 각 비선형 회귀 반복 중에 가중치를 변경할 수 있습니다. 이러한 방식으로 일반적으로 사용되는 방법인 '예측에 의한 가중치'는 reciprocal_pred 가중치 옵션을 선택하면 얻을 수 있습니다.
또한 코시 가중치(weight_Cauchy 선택)를 사용하여 이상값이 포함된 데이터에 방정식을 맞추면 이상값의 영향을 최소화할 수 있습니다. 사용자는 잔차 및/또는 매개변수 측면에서 자신만의 가중치 방법을 생성하여 다른 강력한 피팅 방법을 구현할 수 있습니다. 맞춤 파일의 방정식 섹션은 7가지 기본 제공 가중치 함수와 함께 표시됩니다.
사용자 인터페이스 기능 - 드래그하여 노트북의 항목을 재정렬하세요.
노트북 섹션의 객체가 반드시 논리적 순서대로 만들어지는 것은 아닙니다. 이제 섹션 내의 항목을 새 위치로 드래그하여 보다 논리적으로 배치할 수 있습니다.
업데이트된 시그마플롯 튜토리얼
새로운 튜토리얼을 통해 처음으로 그래프를 쉽게 만들 수 있습니다. 간단한 예제로 시작하여 점점 더 복잡해집니다.
워크시트 열에서 플롯 선 너비 지정하기
이제 워크시트 열에 선 너비 값을 입력할 수 있습니다. 이러한 값은 그래프 내에서 또는 페이지의 여러 그래프에 걸쳐 사용할 수 있습니다.
새로운 벡터 내보내기 파일 형식
SVG(확장 가능한 벡터 그래픽), SWF(어도비 플래시 플레이어) 및 벡터 PDF 파일 형식이 추가되었습니다. 다른 레벨로 확대해도 해상도가 손실되지 않는 확장 가능한 형식입니다. SVG는 웹용 표준 그래픽 형식이며, SWF는 Adobe Flash Player에서 사용할 수 있습니다. PDF가 자주 사용되기 때문에 이제 홈 리본의 PDF 만들기 버튼에 벡터 PDF 형식이 추가되었습니다.
업데이트된 애플리케이션 파일 형식
파일 가져오기 및 내보내기 지원이 Minitab 버전 13 및 14, SAS 버전 9, SPSS 버전 19로 업데이트되었습니다.