4월 9일에 진행되었던 시험문제에 대한 복원문제를 공개합니다!!
복원이 안된 부분에 대해서는 댓글을 달아주신다면 바로 적용해드리겠습니다^^
시험을 보신 여러분에게 도움이 되시길 바랍니다!!
[1과목]
1. HDFS에 대한 설명으로 옳은 것은?
정답 : ③ GFS와 동일한 소스코드를 사용한다
2. 인공지능학습에 대한 설명으로 옳지 않은 것은?
정답 : ④ 훌륭한 알고리즘을 보유하였다면 학습을 생략해도 된다
3. 분산파일 시스템에 대한 설명으로 옳은 것은?
정답 : ③ 여러 컴퓨터를 하나의 서버환경에 저장
4. 분석로드맵 설정시 우선순위 고려해야할 사항 아닌 것은?
정답 : ④ 전략적 중요도
5.
6. 빅데이터 분석기획 절차는?
정답 : ③ 범위설정 -> 프로젝트정의 -> 수행계획수립 -> 위험계획수립
7. 비식별화 문제
8. 개인정보 비식별화 기술에 대한 설명 중 가장 적절하지 않은 것은?
정답 : ② 데이터 마스킹 : 개인식별에중요한 데이터 값을 삭제
9. 가트너가 정의한 빅데이터 처리 플랫폼 특징 중 3V에 속하지 않는 것은?
정답 : ① 가치(value)
10. 1제타바이트에 1byte의 아스키 코드를 넣으면 얼만큼 넣을 수 있는가?
정답 : ④ 2의 70승
11. 다음 중 인메모리기반의 데이터 처리와 연관된 오픈소스 프로젝트는?
정답 : ② 스파크
12. 다음 중 데이터분석 모델링과 관련하여 수행하는 업무가 아닌 것은?
정답 : ③ 프로젝트 성과 분석 및 평가 보고
13. 다음 중 정형데이터와 비정형데이터와 관련된 것 중 옳은 것은?
14. 다음 중 고품질데이터의 특성이 아닌 것은?
정답 : ③ 불편의성(Uncompleteness)
15. 다음 중 시스템의전방에 위치하여 클라이언트로부터 다양한 서비스를 처리하고, 내부 시스템으로 전달하는 미들웨어는?
정답 : ① API 게이트웨이
16. 데이터 3법에 포함되는 것이 아닌 것은?
정답 : ② 정보통신산업 진흥법
17. 공공데이터에서 제공하는 파일의 형식이 아닌 것은?
정답 : ② sql
18. 데이터 저장소가 아닌 것은?
정답 : ③ Data Mining
19. 데이터에 노이즈를 추가해 개인정보와 데이터분석을 모두 진행할 수 있는 방법은?
정답 : ② 차등보호법
20. 빅데이터 저장기술 중 옳은 것은?
정답 : ④ NOSQL
[2과목]
21. 다음 중 대표값관련 설명으로 옳지 않은 것은
정답 : ① 평균은 중앙값보다 이상값에 영향을 더 적게 받는다.
22. 다음 표를 참고하여 귀무 가설 검정으로 옳은 것은?
(위와 비슷한 표 제시)
Z왼쪽 열은 2.5-3.0 까지 있었고 내부 데이터는 모두 0.99이상 값이었음.
99% 신뢰구간. H0 > 35 (부등호, 같거나 크다)
정답 : ④ 표준정규확률변수 z=3, 귀무가설 기각
23. 다음 중 시공간데이터가 아닌 것은?
정답 : ③ 패널 데이터
24. 다음 중 이상값을 찾는 방법에 대한 설명이 아닌 것은?
정답 : ④ 가설 검정의 노이즈 값
25. 다음 중 주성분분석에 대한 설명으로 틀린 것은?
정답 : ④ 직관적으로 이해할 수 있다.
26. 상관관계에 대한 설명 중 틀린 것은?
정답 : ③ 상관계수는 결정계수의 제곱이다
27. 평균이 150, 표준편차가 6인 쥐 한마리 꺼냈는데 100g 일때 분포는?
정답 : ② N(0,1)
28. 박스플롯에서 3Q보다작은건?
정답 : ② 중앙값
29. 맨해튼거리 구하기, a에서 두번째 위치한 거리는?
a(1,1) b(1,2) c(2,2) d(4,1)
정답 : ② 2
30.
31. 평균을 X, 표준편차를 , 크기가 2일때 X1 + X2의 표준편차는 얼마인가?
정답 : ①
32. 비정형 텍스트 테이터 전처리기법이 아닌것은?
33. 자료의 분포가 오른쪽으로 긴꼬리일 경우에 대한 설명으로 맞는 것은?
정답 : ① 왜도 > 0, 빈도수 < 중위수 < 평균
34.
35. A랑 지지도가 있으면 b랑도 지지도가 있다 개념으로 알고리즘하는 것은?
36. 빅데이터 탐색에 대한 설명으로 적절하지 않은 것은?
정답 : ② 데이터 분석과정에서 결과를 도출한다.
37. 표준화와 점수분포에 관한 설명으로 적절한 것은?
정답 : ④ 정규분포를 표준화하면 표준정규분포가 된다.
38. 소수의 극단값의 영향을 받지 않으므로 변동성 척도로서 적절한 것은?
정답 : ② 사분위범위
39. 초기하 분포의 설명으로 적절하지 않은 것은?
정답 : ③ 각 시행은 독립적이다.
40. 다음과 같은 열이 4개인 박스플롯에 대한 설명으로 적절하지 않은 것은?
8
6
4
2
0
x1 x2 x3 x4
정답 : ② x3의 평균은 4에 가깝다.
[3과목]
41. 문장을 2개이상의 단어로 분리하는 방법은?
42. 선형함수 오차항에대한 설명으로 틀린 것은?
43. 비지도학습은 라벨링이 (A) , 예시로는 (B)?
정답 : ③ (A) : 안된거, (B) : 군집
44. 인공신경망의 특징이 아닌 것은?
45. 계단함수가 수행 못하는 것은?
정답 : ④ XOR
46. 오토인코더에 대한 설명 중 틀린 것은?
47. 불린… 나이브 베이지안함수 계산으로 틀린 것은?
48. 의사결정나무에 대한 설명 중 틀린 것은?
49. 범주형에 대한 분류방법이 아닌 것은?
정답 : ② 선형회귀분석
50. 다음이 설명하는 시계열의 특성은 무엇인가?
중장기적인 특성을 가지며, 빈번한 발생빈도 없는 패턴 |
정답 : ② 주기
51. 잔차의 가정이 아닌 것은?
정답 : ① 잔차 끼리 선형적
52. 재현율
53. 데이터 불균형을 평가하는 지표가 아닌것은?
정답 : ② 정확도
54. 다음 중 3사분위 보다 무조건 작은 값은?
55. 앙상블 모형관련 부스터
56. 윌콕슨 부호순위 검정과 윌콕슨 부호 순위합 검정에 대한 설명 틀린 것은?
57. 아래의 수식이 나타내는 회귀는?
정답 : ② 릿지회귀
58. 배깅문제
정답 : ③ 부트스트랩 자료를 생성하고 각 부트스트랩 자료를결합하여 최종 예측모형 산출
59. 실루엣 계수 표를 보고 도출한 수 있는 k수는 무엇인가?
60. 과대적합 대응방법 아닌 것은?
정답 : 답없음
61. 시공간 시각화 기법 중 옳은 것은?
62. 초매개변수의 최적화로 옳지 않은 것은?
정답 : ④ 경사 하강법
63. 다음 그래프의 이름으로 적절한 것은?
(y축) 강동구 / 송파구 / 강남구 / 도봉구 / 노원구
(x축) 발생건수 / 사망자수 / 부상자수
정답 : ① 히트맵
64. y=0 혹은 y=1 값을 가지는 이진 분류 분석에서 y=1의 값이 y=0 값의 2배일 때, 민감도, 특이도, 정확도에 대한 설명으로 적절한 것은?
정답 : ① 민감도와 특이도 둘다 1일때 정확도는 1이다.
65. ROC 그래프의 설명으로 적절하지 않은 것은?
정답 : ④ 특이도가 증가하는 그래프이다.
66. 홀드아웃으로 나눌 수 있는 데이터가 아닌 것은?
정답 : ④ 오그먼트 데이터
67. 비교그래프가 아닌 것은?
정답 : ④ 산점도
68. A 상품 인지도 알아보기위함이다. 옳지 않은 것은?
| 알고있음 | 모름 | 합계 |
아이가 있는 남자 | 460 | 40 | 500 |
아이가 없는 남자 | 440 | 60 | 500 |
합계 | 900 | 100 | 1000 |
69.
54, 46, 60, 40 |
정답 : ④ x2(3) = 7.8일때 귀무가설을 기각한다.
70. 포아송 분포가 맞는지 적합도 검정을 한다 보기중 맞는 것만 고르면?
ㄱ. 하루에 몇회인지 평균을 구해야한다 ㄴ. 카이제곱 값이 클수록 귀무가설 기각 ㄷ. |
71.
72. 비교시각화로 옳지 않은 것은?
73. 효과적인 인포그래픽의 조건 중 가장 적절하지 않은것은?
74. K-fold에 대한 설명 중 옳지 않은 것은?
75. 히스토그램의 특징
76. 상관계수에 대한 설명으로 적절하지 않은것은?
77. FN는 정답인 경우(1)를 우리가 정답이 아닌 것으로(0)로 예측
78. ( )에 들어갈 내용 중 옳은 것은?
정의 > 표준화 > ( ) > 일반화
79. 분석 시나리오 적용을 해야하는 이유로 가장 적절하지 않은 것은?
80. 분석모형 리모델링 및 활용 과정별 명칭과 그 내용에 대하여 잘못 짝지어진 것은?
생각보다 문제복원이 어려워 모든 문제를 복원해드리지 못한점 사과드리며
제4회 빅데이터분석기사 필기 복원은 여기서 종료를 해야할 것 같습니다.
현재까지 복원된 문제들에 대해서는 김계철 선생님의 정답을 달아드렸습니다.
부족하지만 시험보신 여러분들께 도움이 되었으면 좋겠습니다.
감사합니다.