본문으로 바로가기

로딩이미지

[2022년 4월 9일 시행] 제4회 빅데이터분석기사 필기 복원문제 조회수 : 5412 | 작성자 : 프로일잘* 2022.04.09


4월 9일에 진행되었던 시험문제에 대한 복원문제를 공개합니다!!

복원이 안된 부분에 대해서는 댓글을 달아주신다면 바로 적용해드리겠습니다^^

시험을 보신 여러분에게 도움이 되시길 바랍니다!!

 

[1과목]

1. HDFS에 대한 설명으로 옳은 것은?

정답 : ③ GFS와 동일한 소스코드를 사용한다

 

 

2. 인공지능학습에 대한 설명으로 옳지 않은 것은?

정답 : ④ 훌륭한 알고리즘을 보유하였다면 학습을 생략해도 된다

 

 

3. 분산파일 시스템에 대한 설명으로 옳은 것은?

정답 : ③ 여러 컴퓨터를 하나의 서버환경에 저장

 

 

4. 분석로드맵 설정시 우선순위 고려해야할 사항 아닌 것은? 

정답 : ④ 전략적 중요도

 

 

5. 

 

 

6. 빅데이터 분석기획 절차는?

정답 : ③ 범위설정 -> 프로젝트정의 -> 수행계획수립 -> 위험계획수립

 

 

7. 비식별화 문제

 

 

8. 개인정보 비식별화 기술에 대한 설명 중 가장 적절하지 않은 것은?

정답 : ② 데이터 마스킹 : 개인식별에중요한 데이터 값을 삭제

 

 

9. 가트너가 정의한 빅데이터 처리 플랫폼 특징 중 3V에 속하지 않는 것은?

정답 : ① 가치(value)

 

 

10. 1제타바이트에 1byte의 아스키 코드를 넣으면 얼만큼 넣을 수 있는가?

정답 : ④ 2의 70승

 

 

11. 다음 중 인메모리기반의 데이터 처리와 연관된 오픈소스 프로젝트는?

정답 : ② 스파크

 


12. 다음 중 데이터분석 모델링과 관련하여 수행하는 업무가 아닌 것은?

정답 : ③ 프로젝트 성과 분석 및 평가 보고

 


13. 다음 중 정형데이터와 비정형데이터와 관련된 것 중 옳은 것은?

 


14. 다음 중 고품질데이터의 특성이 아닌 것은?

정답 : ③ 불편의성(Uncompleteness)

 


15. 다음 중 시스템의전방에 위치하여 클라이언트로부터 다양한 서비스를 처리하고, 내부 시스템으로 전달하는 미들웨어는?

정답 : ① API 게이트웨이

 

 

16. 데이터 3법에 포함되는 것이 아닌 것은?

정답 : ② 정보통신산업 진흥법

 

 

17. 공공데이터에서 제공하는 파일의 형식이 아닌 것은?

정답 : ② sql

 

 

18. 데이터 저장소가 아닌 것은?

정답 : ③ Data Mining

 

 

19. 데이터에 노이즈를 추가해 개인정보와 데이터분석을 모두 진행할 수 있는 방법은?

정답 : ② 차등보호법

 

 

20. 빅데이터 저장기술 중 옳은 것은?

정답 : ④ NOSQL

 

 

[2과목]

21. 다음 중 대표값관련 설명으로 옳지 않은 것은 

정답 : ① 평균은 중앙값보다 이상값에 영향을 더 적게 받는다.

 


22. 다음 표를 참고하여 귀무 가설 검정으로 옳은 것은?

모평균의 가설검정 문제풀이(σ를 아는 경우)

(위와 비슷한 표 제시)

Z왼쪽 열은 2.5-3.0 까지 있었고 내부 데이터는 모두 0.99이상 값이었음.

99% 신뢰구간. H0 > 35 (부등호, 같거나 크다)

정답 :  표준정규확률변수 z=3, 귀무가설 기각

 


23. 다음 중 시공간데이터가 아닌 것은?

정답 : ③ 패널 데이터


 

24. 다음 중 이상값을 찾는 방법에 대한 설명이 아닌 것은?

정답 : ④ 가설 검정의 노이즈 값


 

25. 다음 중 주성분분석에 대한 설명으로 틀린 것은?

정답 : ④ 직관적으로 이해할 수 있다.


 

26. 상관관계에 대한 설명 중 틀린 것은?

정답 : ③ 상관계수는 결정계수의 제곱이다


 

27. 평균이 150, 표준편차가 6인 쥐 한마리 꺼냈는데 100g 일때 분포는?

정답 : ② N(0,1)

 


28. 박스플롯에서 3Q보다작은건?

정답 : ② 중앙값

 


29. 맨해튼거리 구하기, a에서 두번째 위치한 거리는?

a(1,1) b(1,2) c(2,2) d(4,1)

정답 :  2

 

30. 

 

 

31. 평균을 X, 표준편차를 , 크기가 2일때 X1 + X2의 표준편차는 얼마인가? 

정답 : ① 

 

 

32. 비정형 텍스트 테이터 전처리기법이 아닌것은? 

 

 

33. 자료의 분포가 오른쪽으로 긴꼬리일 경우에 대한 설명으로 맞는 것은?

정답 : ① 왜도 > 0, 빈도수 < 중위수 평균

 

 

34. 

 

 

35. A랑 지지도가 있으면 b랑도 지지도가 있다 개념으로 알고리즘하는 것은?

 

 

36. 빅데이터 탐색에 대한 설명으로 적절하지 않은 것은?

정답 : ② 데이터 분석과정에서 결과를 도출한다.

 

 

37. 표준화와 점수분포에 관한 설명으로 적절한 것은?

정답 : ④ 정규분포를 표준화하면 표준정규분포가 된다.

 

 

38. 소수의 극단값의 영향을 받지 않으므로 변동성 척도로서 적절한 것은?

정답 : ② 사분위범위

 

 

39. 초기하 분포의 설명으로 적절하지 않은 것은?

정답 : ③ 각 시행은 독립적이다.

 

 

40. 다음과 같은 열이 4개인 박스플롯에 대한 설명으로 적절하지 않은 것은?

8

6

4

2

0

     x1 x2 x3 x4

정답 : ② x3의 평균은 4에 가깝다.

 

 

[3과목]

41. 문장을 2개이상의 단어로 분리하는 방법은?

 

 

42. 선형함수 오차항에대한 설명으로 틀린 것은?

 


43. 비지도학습은 라벨링이 (A) , 예시로는 (B)?

정답 : ③ (A) :  안된거, (B) : 군집 



44. 인공신경망의 특징이 아닌 것은?

 


45. 계단함수가 수행 못하는 것은?

정답 : ④ XOR

 


46. 오토인코더에 대한 설명 중 틀린 것은?

정답 : ③ 입력 수는 은닉층수보다 항상 작다.



47. 불린… 나이브 베이지안함수 계산으로 틀린 것은?

 

 

48. 의사결정나무에 대한 설명 중 틀린 것은?

 

 

49. 범주형에 대한 분류방법이 아닌 것은?

정답 : ② 선형회귀분석

 

 

50. 다음이 설명하는 시계열의 특성은 무엇인가? 

중장기적인 특성을 가지며, 빈번한 발생빈도 없는 패턴


정답 : 
② 주기


 

 

51. 잔차의 가정이 아닌 것은?

정답 : ① 잔차 끼리 선형적 

 

 

52. 재현율

 

 

53. 데이터 불균형을 평가하는 지표가 아닌것은?

정답 : ② 정확도

 

 

54. 다음 중 3사분위 보다 무조건 작은 값은?

 

 

55. 앙상블 모형관련 부스터

 

 

56. 윌콕슨 부호순위 검정과 윌콕슨 부호 순위합 검정에 대한 설명 틀린 것은?

 정답 : ④ 윌콕슨 부호 순위 검정은 뭐가 대칭이여야 검정가능하다



57. 아래의 수식이 나타내는 회귀는?

정답 : ② 릿지회귀



58. 배깅문제

정답 : ③ 부트스트랩 자료를 생성하고 각 부트스트랩 자료를결합하여 최종 예측모형 산출

 


59. 실루엣 계수 표를 보고 도출한 수 있는 k수는 무엇인가?

 정답 : ③ 


60. 과대적합 대응방법 아닌 것은?

정답 : 답없음

 


[4과목]

61. 시공간 시각화 기법 중 옳은 것은?

 

 

62. 초매개변수의 최적화로 옳지 않은 것은?

정답 : ④ 경사 하강법

 

 

63. 다음 그래프의 이름으로 적절한 것은?


 

(y)  강동구 / 송파구 / 강남구 / 도봉구 / 노원구

(x발생건수 / 사망자수 / 부상자수

정답 : ① 히트맵

 

 

64. y=0 혹은 y=1 값을 가지는 이진 분류 분석에서 y=1의 값이 y=0 값의 2배일 때민감도특이도정확도에 대한 설명으로 적절한 것은?

정답 : ① 민감도와 특이도 둘다 1일때 정확도는 1이다.

 

 

65. ROC 그래프의 설명으로 적절하지 않은 것은?

정답 : ④ 특이도가 증가하는 그래프이다.

 

 

66.  홀드아웃으로 나눌 수 있는 데이터가 아닌 것은?

정답 : ④ 오그먼트 데이터

 

 

67.  비교그래프가 아닌 것은?

정답 : ④ 산점도

 

 

68.  A 상품 인지도 알아보기위함이다. 옳지 않은 것은?

 

알고있음

모름

합계

아이가 있는 남자

460

40

500

아이가 없는 남자

440

60

500

합계

900

100

1000

 

 

69.  

54, 46, 60, 40


정답 : ④ x2(3) = 7.8일때 귀무가설을 기각한다.

 

 

70.  포아송 분포가 맞는지 적합도 검정을 한다 보기중 맞는 것만 고르면?

 ㄱ. 하루에 몇회인지 평균을 구해야한다

 ㄴ. 카이제곱 값이 클수록 귀무가설 기각

 ㄷ. 

 

 

71.  

 

 

72.  비교시각화로 옳지 않은 것은?

 

 

73.  효과적인 인포그래픽의 조건 중 가장 적절하지 않은것은? 

 

 

74.  K-fold에 대한 설명 중 옳지 않은 것은?

 

 

75.  히스토그램의 특징

 

 

76.  상관계수에 대한 설명으로 적절하지 않은것은? 

 

 

77.  FN는 정답인 경우(1)를 우리가 정답이 아닌 것으로(0)로 예측

 

 

78.  ( )에 들어갈 내용 중 옳은 것은?

정의 > 표준화 > ( ) > 일반화

 

 

79.  분석 시나리오 적용을 해야하는 이유로 가장 적절하지 않은 것은?

 

 

80.  분석모형 리모델링 및 활용 과정별 명칭과 그 내용에 대하여 잘못 짝지어진 것은?

 

생각보다 문제복원이 어려워 모든 문제를 복원해드리지 못한점 사과드리며

제4회 빅데이터분석기사 필기 복원은 여기서 종료를 해야할 것 같습니다.

현재까지 복원된 문제들에 대해서는 김계철 선생님의 정답을 달아드렸습니다.

 

부족하지만 시험보신 여러분들께 도움이 되었으면 좋겠습니다.

감사합니다.

목록보기

상단으로