본문으로 바로가기

로딩이미지

[2023년 5월 21일 시행] 제33회 ADsP 기출 복원 문제(1과목 / 2과목 / 3과목) 조회수 : 7348 | 작성자 : 프로일잘* 2022.05.21


안녕하세요 epassbiz입니다.

 

회원 여러분의 도움으로 기출문제 복원을 마무리할 수 있었습니다.

복원된 문제와 정답은 1과목부터 순차적으로 오픈해드릴 예정입니다!

 

1과목

1. 데이터 사이어티스트의 소프트 스킬 요구역량이 아닌 것은?

이론적 지식

정답 : 

 

 

2. 데이터 양의 크기 순으로 옳은 것은? 

페타바이트 < 엑사바이트 < 제타바이트 < 요타바이트

정답 : 

 

 

3. 데이터베이스 일반적인 특성 아닌 것은?

정형화데이터만 저장

정답 : 

 

 

4. 미래의 빅데이터 관점에서 볼 때 사물인터넷과 가장 관련이 큰 것은?

정답 : 데이터화(Datafication)

 

 

5. 빅데이터의 위기요인 – 통제방안 대한 설명 고르기?

) 사생활침해 - 동의제에서 책임제로

) 책임원칙 훼손 - 알고리즘 접근허용

) 데이터 오용 - 선택 공개

 

정답 : ) : 옳은 설명 / ),) : 틀린설명

 

 

6. 빅데이터 특징 중 올바르지 않는 것은?

정답 : 표본조사의 중요성이 높아졌다.

 

 

7. 빅데이터의 활용에 대한 설명 중 적절하지 않는 것은?

정답 : 서비스업는 증가하고 제조업는 감소한다.

 

 

8. NoSQL 아닌 것 고르기?

Mysql

정답 : 

 

 

단답형 1. 의사결정에 필요한 정보처리 기능을 효율적으로 지원하기 위한 통합된 데이터를 가진 양질의 데이터베이스를 무엇이라 하는가?

정답 : 데이터웨어하우스

 

 

단답형 2. 데이터로부터 의미 있는 정보를 추출해내는 학문이며, 정형 또는 비정형 막론하고 인터넷, 휴대전화, 감시용 카메라 등에서 생성되는 숫자와 문자, 영상 정보 등 다양한 유형의 데이터를 대상으로 하며, 분석뿐 아니라 이를 효과적으로 구현하고 전달하는 과정까지 포함한 포괄적 개념을 무엇이라 하는가?

정답 : 데이터 사이언스

 

 

2과목

1. 빅데이터 분석 방법론에서 분석기획 단계의 task로 적절하지 않은 것은?

정답 : 필요 데이터 정의

 

 

2. 분석마스터 플랜 수립 과정 단계시 분석과제 우선순위 평가기준으로 적절하지 않는 것은? 

정답 : 데이터 필요 우선 순위

 


3. 하향식 접근 방식 프로세스 단계의 순서로 적절한 것은?

정답 : (문제탐색단계 → (문제정의 → (해결방안탐색 → (타당성검토

 


4. 상향식 접근 방식 프로세스에 대한 설명으로 적절하지 않는 것은?

정답 : 상향식 접근 방식의 데이터 분석은 지도학습 방법에 의해 수행된다.

 


5. 빅데이터 분석방법론의 계층적 프로세스 모델에 대한 설명으로 적절하지 않는 것은? 

정답 : Task는 단계를 구성하는 단위 활동으로 input, output로 구성된 단위프로세스이다.



6. 포트폴리오 사분면 분석을 통한 과제 우선순위를 선정하는 기법 중 분석 과제의 적용 우선순위를 시급성에 둔다면 결정해야 할 우선순위는? 

정답 : Ⅲ → Ⅳ → Ⅱ

 


7. 분석과제 프로젝트에 대한 설명 중 적절하지 않는 것은? 

정답 : 정밀도는 실제값이 true인 관측치 중 예측치가 적중한 정도이고 정확도는 예측한 것이 true 일 때 실제값이 true인 것을 의미한다.



8. 분석과제 평가 및 선정에 대해서 적절하지 않는 것은?

정답 : 시급성 판단기준시 가치와 비용으로 평가한다.

 

 

단답형 1. 아래 빈칸에 알맞은 분석 주제 유형은?

 

분석의 대상

known

unknown

분석의 방법

known

optimization

 

unknown

solution

discovery

 

정답 : insight

 

단답형 2. 다음 아래 설명은 어떤 분석 모델 프로세스에 관한 설명인가?

반복을 통하여 점증적으로 개발하는 방법으로써 처음 시도하는 프로젝트에 적용이 용이하지만, 반복에 대한 관리체계를 효과적으로 갖추지 못한 경우 복잡도가 상승하여 프로젝트 진행이 어려울 수 있다.

 

정답 : 나선형(Spiral)모델

 

 

3과목

1. 확률변수 X에 대하여 확률밀도함수가 f(x) 일 때 이산형 확률변수 X의 기대값은?

정답 : E(X) = Σxf(x)



2. 신경망에서 입력되는 데이터를 출력하기 위해 변환하는 함수는?

정답 : 활성화함수



3. 아래의 오분류표를 이용하여 F1 값을 구하면?

정답 : 0.4



4. K-평균(K-means)군집의 단점이 아닌 것은? 

정답 : 한 번군집에 포함되면 다른 군집으로 이동할 수 없다.



5. 연관규칙의 단점이 아닌 것은?

정답 : 품목간에 구체적으로 어떠한 영향을 주는지 해석하기 어렵다.



6. 유클리드 거리를 계산하면?

정답 : √50



7. 아래는 피자와 햄버거의 거래 관계를 나타낸표로,PizzaHamburges는 피자/햄버거를 포함하는 거래수를 의미하고 (Pizza)/(Hamburgers)는 피자/햄버거를 포함하지 않는 거래수를 의미한다. 아래표에서 피자 구매와 햄버거 구매에 대한 설명으로 옳는 것은? 

정답 : 향상도가 1보다 크므로 햄버거와 피자는 연관성이 매우 높다.



8. 다음 중 과대적합(Overfitting)에 대한 설명 중 가장 적절하지 않은 것은? 

정답 : 생성된 모델이 훈련데이터에 최적화되어 있기 때문에 평가용 데이터의 작은변화에 민감하게 반응하지 못한다.



9. 주성분분석에 대한 설명 중 적절하지 않는 것은?

정답 : comp2 로딩벡터 모두 양의 방향을 가지고 있다.



10. 자기조직화지도(SOM)에 대한 설명으로 적절하지 않는 것은? 

정답 : 역전파 알고리즘을 이용하여 예측값과 실제값의 오차를 계산한다.



11. 신뢰구간에 대한 설명으로 가장 적절하지 않는 것은?

정답 : 표본을 재 추출해서 구간추정을 해도 신뢰구간이 동일하게 나온다.



12. 일반적으로 스피어만 상관계수를 계산할 때 대상이 되는 자료의 종류는 무엇인가? 

정답 : 서열척도



13. 표본조사에 대한 설명 중 적절하지 않는 것은?

정답 : 표본편의는 모형추론방법으로 최소화하거나 없앨 수 있다.



14. 다음중 주성분분석에 대한 설명 중 올바른 것은 

정답 : 여러개의 양적변수(Quantiative Variable)들 사이의 분산-공분산 관계를 이용하여 변수들의 선형결합(linear combination)으로 표현 기법

 


15. 주성분분석에서 주성분 수를 선택할 때 고려하지 않아도 되는 것은? 

정답 : 개별 고윳값의 분해 가능 여부

 

 

16. 의사결정나무모형에 관한 내용이다. 적절하지 않은 것은?

정답 : 분리 변수의 P차원 공간에 대한 현재 분할은 이전 분할에 영향을 받지 않는다.



17. 최적회귀방정식의 변수선택 방법에 대한 설명으로 적절하지 않는 것은? 

정답 : 전진선택법은 변수를 추가해도 영향을 받지 않는다.



18. 앙상블 기법에 대한 설명 중 적절하지 않는 것은?

정답 : 부스팅은 배깅의 괴정과 유사하여 재표본과정에서 각 자료에 동일한 확률을 부여하여 여러 모형을 만들어 결합하는 방식이다.



19. 질병률 계산문제?

정답 : 0.45



20.재현율 계산문제?

정답 : 3/10



21. age_jobclass 관련 틀린문제?

정답 : 유의하지 않다.

 


22. 분해시계열에 대한 설명 중 옳지 않는 것은? 

정답 : 이동평균법

 


23. 나무 5개 종의 나이, 둘레에 따른 분석결과로 옳지 않은 것은 

정답 : 나무 age와 두께, 키가 유의한 관계를 가진다.

 


24. 오렌지 우상향 산점도

정답 : 종별로 관계를 나타낼수 있다

 

 

단답형 5. 로지스틱 회귀모형에서 exp(x1)의 의미는 나머지 변수가 주어질 때 x1이 한 단위 증가할 때마다 성공(Y=1)( )가 몇 배 증가하는지를 나타낸다. ( )에 들어가는 용어는? 

정답 : 오즈



단답형 6. 덴드로 그램을 결과의 height 60일 때 군집수는?

정답 : 4



단답형 7. 이것은 귀무가설 H0가 실제로는 사실이어서 채택하여야 함에도 불구하고이를 기각하는 오류를 말한다.

정답 : 1종오류



단답형 8. 입력받은 값을 출력으로 0~1 사이의 값으로 모두 정규화하며 출력 값들의 총합은 항상 1이 되는 특성을 가진 다범주 분류에 활용되는 신경망 활성함수를 무엇이라 하는가?

정답 : 소프트맥스함수



단답형 9. 은닉층이 다층인 신경망을 학습하다 보면 역전파 과정에서 초기 부분의 입력층으로 갈수록 기울기가 점차적으로 작아지는 현상은? 

정답 : 기울기소실 문제



단답형 10. 분류모형평가에서 실제값이 False인 관측치 중 예측치가 적중한 정도를 나타내는 평가지표를 무엇이라 하는가? 

정답 : 특이도

 

 

3과목 14번, 21번, 22번, 23번, 24번 문제와 보기, 그리고 정답을 이메일(cpa@epasskorea.com)로 보내주신 덕분에 문제복원이 완료되었습니다.

  이메일로 남겨주신 분들께는 5,000원 상품권을 드리도록 하겠습니다.



위 내용이 33회 ADsP 최종복원문제입니다.


감사합니다.

목록보기

상단으로