본문 바로가기

전체 글71

모라벡의 역설 쉽게 이야기하기 모라벡의 역설을 이야기하기 전에 우선 머신러닝은 정형 데이터(데이터 방식으로 저장된 것)를 다루고자 하고 딥러닝은 비정형 데이터(데이터 방식으로 저장되지 않는 것)를 다루고자 한다라는 것을 다시 한번 기억해두시면 좋을 것 같습니다. Q. 모라벡의 역설 정의가 무엇인가요? 모라벡의 역설은 인공 지능 및 로봇 연구원이 높은 수준의 추론을 위해서는 계산이 거의 필요 없지만 낮은 수준의 기술(걷기, 듣기, 느끼기, 눈으로 보기 등)은 엄청난 양의 연산 리소스가 필요하다는 발견이다. 이 원칙은 1980년대 한스 모라벡, 로드니 부룩, 마빈 민스키 등에 의해 더욱 분명해졌다. 모라벡은 '컴퓨터가 지능 테스트와 같은 테스트에서는 성인 수준의 성능을 보이게 하는 것은 비교적 쉽지만 오히려 지각하고 이동하는 등의 쉬운 .. 2021. 12. 14.
DRM문서 쉽게 이야기하기 업무를 하다 보면 DRM 문서라는 것을 접하게 됩니다. 문서 보안을 하는 건 하는 건 알겠는 데 어떤 거일까요? 또 문서 보안은 DRM 밖에 없는 걸까요? Q. DRM 문서란 뭔가요? DRM(Digital Right Management)는 출판자 또는 저작권자가 그들이 배포한 디지털 자료나 하드웨어의 사용을 제어하고 이를 의도한 용도로만 사용하도록 제한하는 데 사용되는 모든 기술들을 지칭하는 용어이다. CDM(Content Decryption Module)에 기반한다. 이는 종종 복사 방지, 기술 보호 장치와 혼동하기도 한다. (중략) 기업의 기밀 사항을 담고 있는 내부 문서를 외부로 유출되지 않도록 관리하는 데 사용된다. - 출처: 위키백과 즉, 문서를 비롯한 정보 관련 자산을 암호화하여 외부에 유출되.. 2021. 12. 13.
과적합(Overfitting) 쉽게 이야기하기 머신러닝에서 학습 데이터를 과하게 학습하는 것을 뜻한다. 일반적으로 학습 데이터는 실제 데이터의 부분 집합이므로 학습 데이터에 대해서는 오차가 감소하지만 실제 데이터에 대해서는 오차가 증가하게 된다. 출처: 위키백과 Q. 학습 데이터를 많이 공부하면 좋은 게 아닌가요? 왜 문제가 되죠? 데이터를 많이 하긴 했는 데 너무 적은 수의 학습을 한 것입니다. 강아지를 공부하고 있는 데 너무 흰색 비숑에 대해서만 공부를 하다 보니 비숑이 염색을 조금이라도 하면 비숑이 아니라고 생각하는 것입니다. 그동안 너무 흰색 비숑만 봐왔기 때문이죠. Q. 그럼 과적합은 항상 발생하나요? 과적합은 데이터가 적을수록 많이 발생합니다. 복잡할 경우도 발생한다고 하는 경우도 있는 데 만약에 데이터가 많을 경우 복잡하더라도 발생하지 .. 2021. 12. 12.
ALM(Application Life Cycle) 쉽게 이야기하기 ALM이라는 것은 뭘까요? 알람의 약자일까요? 오늘은 ALM에 대해서 쉽게 알아보겠습니다. Q. ALM은 뭔가요? ALM은 어플리케이션의 수명 주기 관리라고합니다. 어플리케이션의 수명을 관리한다는 것은 요구 사항 관리, 소프트웨어 아키텍쳐, 개발, 테스트, 유지 관리, 변경 관리, 연속 통합, 프로젝트 관리, 배포, 릴리즈 관리와 같은 분야가 포함되는 것입니다. 쉽게 말해 주기적으로 소프트웨어를 계속 개발해 나가는 모든 내용을 관리하는 것 입니다. Q. 어떤 걸 포함한다는 거죠? Microsoft에서 이야기하는 ALM의 주요 영역은 아래와 같습니다. 1. 거버넌스 - 요구 사항 관리, 리소스 관리, 데이터 보안, 사용자 액세스, 변경 내용 추적, 검토, 감사, 배포 제어 및 롤백 2. 애플레이케이션 개발.. 2021. 12. 12.
인공지능 학습용 데이터의 특징 쉽게 이야기하기 인공지능 데이터가 가진 특징이 있는 데 오늘은 그 특징에 대해 알아보고자 합니다. Q. 인공지능 데이터는 어떤 특징을 가지고 있나요? 첫째, 데이터의 저장 구조가 전통적인 DB에 저장하는 방식이 아닌 인공지능 학습에 필요한 데이터 파일 단위로 관리되는 특성이 있습니다. 둘째, 인공지능 학습용 데이터는 구축 단계별(임무 정의-데이터 획득-데이터 정제-데이터 라벨링-데이터 학습)로 고려해야 할 품질이나 요구사항이 다릅니다. 셋째, 데이터의 품질은 80%~90% 이상이 구축 과정에서 결정된다. 그 이유는 인공지능 학습용 데이터는 목적성을 갖는 데이터이기 때문입니다. 넷째, 학습된 인공지능 모델의 성능 측정 결과로 데이터의 품질 수준을 평가하려는 특성이 있습니다. 인공지능 데이터는 학습을 목적으로 구축되는 데이.. 2021. 12. 11.
DICOM(.dcm) 파일 쉽게 이야기하기 DICOM(Digital Imaging and Communications in Medicine) 이란 의료 영상 표준을 이야기합니다. Q. 의료영상 표준이란 뭘까요? 우선 표준이란 약속을 의미합니다. "우리 이렇게 하자~!"라는 것이죠. 전자기기의 전원 아이콘 보면 모두 동일합니다. 이것 역시 아이콘의 표준으로 "자! 우리 모두 이렇게 하자!"라는 것이죠. 즉, DICOM 파일이라는 것은 자 우리 모두 의료영상은 DICOM으로 하자라고 약속을 한 것입니다. Q. 왜 표준을 정한 거죠? 만약에 표준을 정하지 않으면 어떻게 될까? 한번 번 생각해봅시다. 삼성과 애플의 예를 들어보겠습니다. 삼성과 애플은 서로 충전기가 호환되지 않습니다. 삼성폰은 C타입 애플폰은 8핀을 쓰기 때문이죠. 그래서 제가 삼성 휴대폰.. 2021. 12. 11.
반응형