RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      정규화 방법을 이용한 다층모형에서의 변수 선택 = Variable selection in multilevel model using a regularization method

      한글로보기

      https://www.riss.kr/link?id=T15532468

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      본 연구는 교육 분야에서 가장 많이 사용되는 양적연구방법 중 하나인 다층모형의 변수 선택에 관한 연구이다. 최근의 연구에서는 연구자가 직접 자료를 수집하는 것이 아닌 연구 기관 등에서 수집된 자료를 분석하는 경우가 빈번하다. 해당 수집된 자료는 변수의 개수가 많은 대용량 자료로서 연구 모형에 포함될 변수를 선택하는 과정이 더욱 중요해졌다. 이러한 맥락에서 볼 때 기존 변수 선택 방법인 전진선택법, 후진소거법, 단계선택법등의 전통적인 회귀모형에서의 변수 선택 접근법은 한계를 갖는다. 변수의 개수가 많아지면 전통적인 변수 선택 방법을 사용하기에는 현실적인 문제와 더불어 추정치 또한 불안정해진다는 문제가 생긴다. 따라서 기존 변수 선택 방법에 대한 대안적 접근법이 필요하다.
      본 연구에서는 기계학습 기법중 하나인 정규화 방법을 사용하는 벌점회귀모형이 위계를 고려할 수 있는 다층모형에 적용된 glmmLasso 알고리즘을 변수 선택의 대안적 접근법으로 채택하여 모의실험을 통해 해당 방법의 성능을 확인하고 실제 자료에 적용하였다.
      모의실험 1에서는 glmmLasso를 처음 소개한 학술논문의 모의실험을 재연하였고, 모의실험 2에서는 재연의 결과를 발전시켜 교육 분야의 대용량 자료에서도 glmmLasso가 적절한 위계를 고려한 변수 선택 방법임을 확인하였다. 모의실험 3에서는 기존 벌점회귀모형을 glmmLasso와 비교하여 위계를 고려하지 않은 모형과 고려한 모형의 변수 선택 결과를 비교하였다. 이를 통해서 위계가 있는 자료에 대하여 변수 선택을 진행함에 있어서 기존의 벌점회귀모형보다 glmmLasso가 무선효과가 비교적 큰 경우에 더 좋은 성능을 갖는 다는 것을 확인하였다. 이는 변수 탐색이라는 관점에서 위계를 고려해야 하거나 고려할 필요가 있는 경우에 기존 벌점회귀모형 대신에 glmmLasso를 활용할 수 있음을 시사한다.
      glmmLasso의 적용을 위해 사용한 자료는 한국교육고용패널 Ⅱ 1차(2016)년도 자료이며, 반응변수는 ‘사교육 경험 여부’이다. 모형을 여러 번 적합한 뒤 모형에 변수가 포함된 횟수인 관련성 계수와 함께 고려한 결과, 고등학교 2학년 학생의 사교육 경험에 영향을 미치는 변수로 13개가 선택되었다.
      모의실험과 실제 분석결과를 바탕으로 다층모형에서 glmmLasso는 대안적 변수 선택 방법으로 적절하며, 교육학 자료에서도 사용가능한 방법임을 확인할 수 있었다. 마지막으로 glmmLasso가 갖는 제한점과 관련하여 제언하였다.
      번역하기

      본 연구는 교육 분야에서 가장 많이 사용되는 양적연구방법 중 하나인 다층모형의 변수 선택에 관한 연구이다. 최근의 연구에서는 연구자가 직접 자료를 수집하는 것이 아닌 연구 기관 등에...

      본 연구는 교육 분야에서 가장 많이 사용되는 양적연구방법 중 하나인 다층모형의 변수 선택에 관한 연구이다. 최근의 연구에서는 연구자가 직접 자료를 수집하는 것이 아닌 연구 기관 등에서 수집된 자료를 분석하는 경우가 빈번하다. 해당 수집된 자료는 변수의 개수가 많은 대용량 자료로서 연구 모형에 포함될 변수를 선택하는 과정이 더욱 중요해졌다. 이러한 맥락에서 볼 때 기존 변수 선택 방법인 전진선택법, 후진소거법, 단계선택법등의 전통적인 회귀모형에서의 변수 선택 접근법은 한계를 갖는다. 변수의 개수가 많아지면 전통적인 변수 선택 방법을 사용하기에는 현실적인 문제와 더불어 추정치 또한 불안정해진다는 문제가 생긴다. 따라서 기존 변수 선택 방법에 대한 대안적 접근법이 필요하다.
      본 연구에서는 기계학습 기법중 하나인 정규화 방법을 사용하는 벌점회귀모형이 위계를 고려할 수 있는 다층모형에 적용된 glmmLasso 알고리즘을 변수 선택의 대안적 접근법으로 채택하여 모의실험을 통해 해당 방법의 성능을 확인하고 실제 자료에 적용하였다.
      모의실험 1에서는 glmmLasso를 처음 소개한 학술논문의 모의실험을 재연하였고, 모의실험 2에서는 재연의 결과를 발전시켜 교육 분야의 대용량 자료에서도 glmmLasso가 적절한 위계를 고려한 변수 선택 방법임을 확인하였다. 모의실험 3에서는 기존 벌점회귀모형을 glmmLasso와 비교하여 위계를 고려하지 않은 모형과 고려한 모형의 변수 선택 결과를 비교하였다. 이를 통해서 위계가 있는 자료에 대하여 변수 선택을 진행함에 있어서 기존의 벌점회귀모형보다 glmmLasso가 무선효과가 비교적 큰 경우에 더 좋은 성능을 갖는 다는 것을 확인하였다. 이는 변수 탐색이라는 관점에서 위계를 고려해야 하거나 고려할 필요가 있는 경우에 기존 벌점회귀모형 대신에 glmmLasso를 활용할 수 있음을 시사한다.
      glmmLasso의 적용을 위해 사용한 자료는 한국교육고용패널 Ⅱ 1차(2016)년도 자료이며, 반응변수는 ‘사교육 경험 여부’이다. 모형을 여러 번 적합한 뒤 모형에 변수가 포함된 횟수인 관련성 계수와 함께 고려한 결과, 고등학교 2학년 학생의 사교육 경험에 영향을 미치는 변수로 13개가 선택되었다.
      모의실험과 실제 분석결과를 바탕으로 다층모형에서 glmmLasso는 대안적 변수 선택 방법으로 적절하며, 교육학 자료에서도 사용가능한 방법임을 확인할 수 있었다. 마지막으로 glmmLasso가 갖는 제한점과 관련하여 제언하였다.

      더보기

      다국어 초록 (Multilingual Abstract) kakao i 다국어 번역

      This study is regarding variable selection in multilevel models which are widely used quantitative research methods in education field. The data collected by research institution is commonly used in recent research. That data has a lot of variables so that procedures to select variables would be included in research model became more important. In this context conventional variable selection technique in regression model has its limitations The more variables in data, the harder to use this conventional approaches, because they have a realistic problem and yield unstable estimates.
      Therefore an alternative approach to the conventional methods is needed. Accordingly I adopt the glmmLasso algorithm applied penalized regression that is one of the machine learning technique to select variables. This algorithm can concern the hierarchical structure. In the following there are verifying the glmmLasso’s performance by simulation studies and applying that to real data.
      In simulation study 1, there is replicating simulation study in the paper that first introduced the glmmLasso. In simulation study 2, the results of replicate are developed to simulate whether glmmLasso is a suitable variable selection methods in multilevel models for large-scale data in the field of education. And it is checked that glmmLasso is suitable for variable selection in multilevel models.
      In simulation study 3, the results of variable selection via traditional penalized regression and the glmmLasso which is regarding hierarchy are compared. Through this in variable selection for hierarchical data, it was checked that glmmLasso have better performance than the conventional penalized regression when the random effect is relatively higher. This suggests that glmmLasso can be used in place of the traditional penalized regression model when hierarchy structure need to or have to be considered in terms of variable selection.
      The real data used for the application of glmmLasso is the 1st (2016) year of the Korean Education & Employment Panel and the response variable is 'the experience of private education'. After fitting the model several times and considering the relevance count which is the number of times the selected variables are contained the model, 13 variables were selected to influence the private education experience of second-year high school students
      Based on the simulation and real data analysis results, glmmLasso was suitable as an alternative variable selection method of the multilevel models and could be used as an education field data. Finally, suggestions are made regarding the limitations of glmmLasso.
      번역하기

      This study is regarding variable selection in multilevel models which are widely used quantitative research methods in education field. The data collected by research institution is commonly used in recent research. That data has a lot of variables so...

      This study is regarding variable selection in multilevel models which are widely used quantitative research methods in education field. The data collected by research institution is commonly used in recent research. That data has a lot of variables so that procedures to select variables would be included in research model became more important. In this context conventional variable selection technique in regression model has its limitations The more variables in data, the harder to use this conventional approaches, because they have a realistic problem and yield unstable estimates.
      Therefore an alternative approach to the conventional methods is needed. Accordingly I adopt the glmmLasso algorithm applied penalized regression that is one of the machine learning technique to select variables. This algorithm can concern the hierarchical structure. In the following there are verifying the glmmLasso’s performance by simulation studies and applying that to real data.
      In simulation study 1, there is replicating simulation study in the paper that first introduced the glmmLasso. In simulation study 2, the results of replicate are developed to simulate whether glmmLasso is a suitable variable selection methods in multilevel models for large-scale data in the field of education. And it is checked that glmmLasso is suitable for variable selection in multilevel models.
      In simulation study 3, the results of variable selection via traditional penalized regression and the glmmLasso which is regarding hierarchy are compared. Through this in variable selection for hierarchical data, it was checked that glmmLasso have better performance than the conventional penalized regression when the random effect is relatively higher. This suggests that glmmLasso can be used in place of the traditional penalized regression model when hierarchy structure need to or have to be considered in terms of variable selection.
      The real data used for the application of glmmLasso is the 1st (2016) year of the Korean Education & Employment Panel and the response variable is 'the experience of private education'. After fitting the model several times and considering the relevance count which is the number of times the selected variables are contained the model, 13 variables were selected to influence the private education experience of second-year high school students
      Based on the simulation and real data analysis results, glmmLasso was suitable as an alternative variable selection method of the multilevel models and could be used as an education field data. Finally, suggestions are made regarding the limitations of glmmLasso.

      더보기

      목차 (Table of Contents)

      • Ⅰ. 서론 1
      • 1. 연구의 필요성 및 목적 1
      • 2. 연구 문제 8
      • Ⅱ. 이론적 배경 10
      • 1. GLMM(generalized linear mixed model 10
      • Ⅰ. 서론 1
      • 1. 연구의 필요성 및 목적 1
      • 2. 연구 문제 8
      • Ⅱ. 이론적 배경 10
      • 1. GLMM(generalized linear mixed model 10
      • 2. LASSO와 elastic net 12
      • 가. LASSO 13
      • 나. elastic net 14
      • 3. 조율모수(tuning parameter) 15
      • Ⅲ. 연구 방법 18
      • 1. glmmLasso 19
      • 가. glmmLasso 알고리즘 19
      • 나. glmmLasso 조율모수 결정 24
      • 2. 모의실험 25
      • 가. 자료생성 26
      • 나. 모의실험 절차 29
      • 3. 실제 자료 적용 31
      • 가. 자료 정리 32
      • 나. 반응변수와 설명변수 33
      • Ⅵ. 연구 결과 35
      • 1. 모의실험 결과 35
      • 가. 모의실험 1 35
      • 나. 모의실험 2 38
      • 다. 모의실험 3 42
      • 2. 실제 자료 분석 결과 46
      • Ⅴ. 결론 및 제언 51
      • 1. 결론 51
      • 2. 제언 53
      • 참고 문헌 55
      • ABSTRACT 58
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼