일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Deeplearning
- 데이터분석
- 케라스
- 빅데이터분석기사
- 데이터사이언스
- 빅분기
- 의학논문
- 의학통계
- 코딩테스트
- Keras
- 데이터EDA
- 머신러닝
- 통계
- 컴퓨터비전
- 텐서플로우
- 빅분기실기
- CNN
- 데이터모델링
- 데이터분석가
- Python
- 데이터전처리
- 파이썬
- 딥러닝
- TensorFlow
- mnist
- AI
- machinelearning
- 인공지능
- ComputerVision
- resnet
- Today
- Total
목록전체 글 (47)
Be Brave, Be Humble

거두절미하고 간략하게 공부법과 책, 그리고 후기만 소개함. 책: 2022 이기적 빅데이터분석기사 필기 기본서 2022 이기적 빅데이터분석기사 필기 기본서 : 벤티북 [벤티북] 인터넷 전문 서점 입니다 smartstore.naver.com - 선택 이유: 목차와 내용이 제일 깔끔하게 정리되어 있으며 매 챕터마다 연습문제가 있음. - 공부법: 합격이 목표지 만점이 목표인 시험이 아니기에 냅다 연습문제 먼저 풀음. 몰라도 풉니다. 다 푼 후 개념을 읽으며, 연습문제에 많이 나왔던 내용은 꼼꼼히 봅니다. 암기는 하지 않았습니다. 귀찮아서.. 다 읽은 후에 다시 연습문제를 풉니다. 틀린 문제가 거의 없을 테지만, 맞든 틀리든 모든 문제 옆에 나름대로 해설을 적습니다. 그다음 답지를 읽으며 내가 적은 해설이 맞는지..
Parametric (모수)/ Non-parametric (비모수) 방법론에 관련하여 자문 받았던 내용들을 기반으로 작성하겠습니다. 1. 모수/ 비모수가 뭔가요? 데이터값 자체로 분석하는 게 모수적 방법이며, 데이터의 rank(순위)를 사용하는 것이 비모수적 방법론입니다. 키를 예로 들면 모수적 방법론은 181, 179, 130 이 값 자체를 사용하며 비모수적 방법론은 130, 170, 181로 정렬하여 130은 1등, 170은 2등, 181은 3등 이렇게 순위를 부여하여 이 '순위 차이'를 계산하는 것입니다. 2. 어떻게 선택하나요? 30명이면 모수 아닌가요? 이전 포스팅에도 말했듯이 샘플사이즈에 절대적인 기준이란 없습니다. 제발 30명을 잊으세요. 데이터가 정규성을 만족하면 모수적 방법론, 만족하지 ..
데이터는 모았고 연구 주제도 정했는데 방법론을 선택하지 못한 연구자들이 많습니다. 저 또한 분석 방법에 대한 질문을 정말 많이 받았습니다. 생각나는대로 간략히 정리해보겠습니다. "도대체 어떤 방법론을 써야하나요?", "통계 너무 어려워요.. 선생님께서 적절한 방법으로 해주세요", "이 논문에선 이렇게 했는데 왜 저는 안 되나요?", "생존분석이 제일 좋은 거 아니에요?" ... 등등 - "도대체 어떤 방법론을 써야하나요?" 세운 가설에 따라 다릅니다만, 가장 쉬운 방법은 해석을 생각하면 되겠습니다. 가장 많이 쓰이는 방법론만 간략히 소개합니다. (통계 전공자이기 때문에 예시가 적절하지 않을수도 있으나 데이터의 유형에 초점을 맞춰 봐주세요) a. Linear regression(선형 회귀) 종속변수가 연속..
전 회사 연구원이 도움을 요청하여 생각난 김에 간략히 작성하는 글^^ㅠ 논문 리비전 시 샘플 사이즈 혹은 검정력을 기술하라는 의견을 받는 경우가 많은데, 개념이 생소한 연구자를 위해 간략히 설명합니다. 책 요약이 아닌 필드에서 직접 겪은 경험을 기반으로 작성했기 때문에 실제 리비전에서 활용하시기 좋을 것이라 생각합니다. 1. Sample size calculation 표본 수 계산은 IRB 심사를 위한 '연구계획서 작성 단계'에서 레퍼런스 논문을 참고하여 산출합니다. '이전 연구에서는 nn명으로 임상시험을 진행했으니 우리 연구에서는 대략 xx명을 사용하면 믿을만한 결과를 얻을 수 있을 것 같다'고 명시하는 과정이기에 꼭 데이터 수집 전 계획단계!!에서 진행해야 합니다. 통계 책 보니까 30명이면 된다는데..

https://github.com/FulISun/Computer_Vision/blob/main/CNN/03_Fashion_MNIST_callbacks.ipynb Fashion MNIST Example 정확도가 잘 안나오면 하이퍼 파라미터 먼저 수정하기~ learning rate -> epoch -> architecture 순으로 수정할 것 accuracy는 그대로인데 loss만 감소하는 경우는 맞추는 값만 맞추고 틀린 값은 계속 틀려서 => decision making 필요함. 데이터 확인해서 코딩 오류 수정하거나 해당 값 삭제 해야함 ex) 정답 = [ 1, 2, 3, 4 ] 예측1 = [ 1, 2, 3, 3 ] 예측2 = [ 1, 2, 3, 10 ] 인 경우 둘 다 정확도는 0.75지만 loss가 예..

https://github.com/FulISun/Computer_Vision/blob/main/CNN/02_NN_MNIST_sparse_dropout_batchnormalization.ipynb Sparse ver [1] MNIST Data 생성 및 확인 In [ ]: import tensorflow as tf import numpy as np from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Flatten, Dropout, BatchNormalization from tensorflow.keras.datasets import mnist from tensorflow.keras.utils impor..

https://github.com/FulISun/Computer_Vision/blob/main/CNN/01_NN_MNIST_example_onehot.ipynb MNIST Example [1] MNIST Data 생성 및 확인 In [ ]: import tensorflow as tf import numpy as np from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Flatten from tensorflow.keras.datasets import mnist from tensorflow.keras.utils import to_categorical In [ ]: (X_train, t_train), ..