본문 바로가기

소년의 IT 쉽게 이해하기/인공지능 쉽게 이해하기8

Precision, Recall, Accuracy 쉽게 이야기하기 분류성능평가지표 중 Precision(정밀도), Recall(재현율), Accuracy(정확도)은 머신러닝(Machine Learning) 성능 평가 중 중요하고 기본이 되는 지표이기 때문에 한 번 알아보고자 합니다. Q. Precision, Recall, Accuracy가 뭔가요? Percision, Recall, Accuracy는 논문에서도 많이 보이는 지표이며 또 그만큼 중요하게 생각하는 지표입니다. 하지만 이것을 이야기하기전에 뭔저 알아야할 것이 있습니다. 그것은 바로 TP(True Positive), FP(False Positive), TN(True Negative), FN(False Negative)입니다. 이것에 대해 각각 이야기하면 아래와 같습니다. - TP(True Positive): 실.. 2021. 12. 31.
모라벡의 역설 쉽게 이야기하기 모라벡의 역설을 이야기하기 전에 우선 머신러닝은 정형 데이터(데이터 방식으로 저장된 것)를 다루고자 하고 딥러닝은 비정형 데이터(데이터 방식으로 저장되지 않는 것)를 다루고자 한다라는 것을 다시 한번 기억해두시면 좋을 것 같습니다. Q. 모라벡의 역설 정의가 무엇인가요? 모라벡의 역설은 인공 지능 및 로봇 연구원이 높은 수준의 추론을 위해서는 계산이 거의 필요 없지만 낮은 수준의 기술(걷기, 듣기, 느끼기, 눈으로 보기 등)은 엄청난 양의 연산 리소스가 필요하다는 발견이다. 이 원칙은 1980년대 한스 모라벡, 로드니 부룩, 마빈 민스키 등에 의해 더욱 분명해졌다. 모라벡은 '컴퓨터가 지능 테스트와 같은 테스트에서는 성인 수준의 성능을 보이게 하는 것은 비교적 쉽지만 오히려 지각하고 이동하는 등의 쉬운 .. 2021. 12. 14.
과적합(Overfitting) 쉽게 이야기하기 머신러닝에서 학습 데이터를 과하게 학습하는 것을 뜻한다. 일반적으로 학습 데이터는 실제 데이터의 부분 집합이므로 학습 데이터에 대해서는 오차가 감소하지만 실제 데이터에 대해서는 오차가 증가하게 된다. 출처: 위키백과 Q. 학습 데이터를 많이 공부하면 좋은 게 아닌가요? 왜 문제가 되죠? 데이터를 많이 하긴 했는 데 너무 적은 수의 학습을 한 것입니다. 강아지를 공부하고 있는 데 너무 흰색 비숑에 대해서만 공부를 하다 보니 비숑이 염색을 조금이라도 하면 비숑이 아니라고 생각하는 것입니다. 그동안 너무 흰색 비숑만 봐왔기 때문이죠. Q. 그럼 과적합은 항상 발생하나요? 과적합은 데이터가 적을수록 많이 발생합니다. 복잡할 경우도 발생한다고 하는 경우도 있는 데 만약에 데이터가 많을 경우 복잡하더라도 발생하지 .. 2021. 12. 12.
인공지능 학습용 데이터의 특징 쉽게 이야기하기 인공지능 데이터가 가진 특징이 있는 데 오늘은 그 특징에 대해 알아보고자 합니다. Q. 인공지능 데이터는 어떤 특징을 가지고 있나요? 첫째, 데이터의 저장 구조가 전통적인 DB에 저장하는 방식이 아닌 인공지능 학습에 필요한 데이터 파일 단위로 관리되는 특성이 있습니다. 둘째, 인공지능 학습용 데이터는 구축 단계별(임무 정의-데이터 획득-데이터 정제-데이터 라벨링-데이터 학습)로 고려해야 할 품질이나 요구사항이 다릅니다. 셋째, 데이터의 품질은 80%~90% 이상이 구축 과정에서 결정된다. 그 이유는 인공지능 학습용 데이터는 목적성을 갖는 데이터이기 때문입니다. 넷째, 학습된 인공지능 모델의 성능 측정 결과로 데이터의 품질 수준을 평가하려는 특성이 있습니다. 인공지능 데이터는 학습을 목적으로 구축되는 데이.. 2021. 12. 11.
인공지능 데이터 쉽게 이야기하기 인공지능은 교육을 통해서 학습합니다. 그렇다면 인공지능이 학습할 수 있는 데이터가 필요하겠죠? 그 데이터에 대해서 이야기해보고자 합니다. Q. 인공지능 데이터를 준비하는 데도 과정 같은 게 있나요? 우리 사람도 학습을 하려면 우선 무엇을 공부할지 정하고 관련 자료의 정보를 찾은 뒤 정말 필요한 정보만 따로 저장해 둡니다. 그리고 그중에서도 정말 중요한 내용은 별도 메모 혹은 기록해두죠. 인공지능도 이러한 일련의 과정이 필요합니다. 이 과정의 순서를 [임무 정의] -> [데이터 획득] -> [데이터 정제] -> [데이터 라벨링] -> [데이터 학습]이라고 이야기하기로 했습니다. Q. 각 단계에 대해서 쉽게 설명해줄 수 있을까요? 임무 정의 단계: 무엇을 공부할 것인가?입니다. 인공지능을 학습시키는 이유는 .. 2021. 12. 10.
DL(Deep Learning) 쉽게 이야기하기 인공신경망 이름만 들어도 벌써 머리가 지끈한 단어입니다. 딥러닝은 그냥 사람의 뇌를 따라한 것입니다. 사람의 뇌가 동작하는 걸 보고 '아~! 컴퓨터도 사람처럼 생각했으면 좋겠으니 사람의 뇌를 한번 따라 해 보자!"라는 것이죠. Q. 사람의 뇌를 따라 해 보자라는 게 뭐지? 사람은 자전거를 보여주고 일부를 가렸을 때 '아 이거 뭔지 모르겠어!'라며 이야기하지 않습니다. '어.. 자전거이지 않을까?'라고 어느 정도 추측 가능하여, 자전거 일 것 같아!라고 이야기합니다. 하지만 앞서 말한 머신러닝에서 컴퓨터는 자전거의 특징 일부를 가려버리면 컴퓨터는 '나 이거 뭔지 모르겠어' 이렇게 나오게 됩니다. 컴퓨터도 '자전거일 것 같아.'라고 말하도록 하기 위한 것이 '사람의 뇌를 따라 해 보자!'라는 것입니다. Q... 2021. 12. 5.
반응형