휘트의 데이터 일지

SQL 코딩테스트 연습_프로그래머스_Level2 / 재구매가 일어난 상품과 회원 리스트 구하기

https://school.programmers.co.kr/learn/courses/30/lessons/131536 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr 🔍문제 설명[재구매가 일어난 상품과 회원 리스트 구하기]다음은 어느 의류 쇼핑몰의 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 ONLINE_SALE_ID, USER_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.(동일한 날짜, 회원 ID, 상품 I..

코딩테스트 2025.02.21

SQL 코딩테스트 연습_프로그래머스_Level2 / 조건에 맞는 개발자 찾기

https://school.programmers.co.kr/learn/courses/30/lessons/276034 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr 🔍문제 설명[조건에 맞는 개발자 찾기]SKILLCODES 테이블은 개발자들이 사용하는 프로그래밍 언어에 대한 정보를 담은 테이블입니다. SKILLCODES 테이블의 구조는 다음과 같으며, NAME, CATEGORY, CODE는 각각 스킬의 이름, 스킬의 범주, 스킬의 코드를 의미합니다.스킬의 코드는 2진수로 표현했을 때 각 bit로 구분될 수 있도록 2의 제곱수로 구성되어 있습니다.DEVELOPERS 테이블은 개발자들의 프로그래밍 스킬 정보..

코딩테스트 2025.02.20

SQL 코딩테스트 연습_프로그래머스_Level3 / 대장균들의 자식의 수 구하기

https://school.programmers.co.kr/learn/courses/30/lessons/299305 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr 🔍문제 설명[대장균들의 자식의 수 구하기]대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ..

코딩테스트 2025.02.20

SQL 코딩테스트 연습_프로그래머스_Level3 / 대장균의 크기에 따라 분류하기 1

코딩테스트 연습 - 대장균의 크기에 따라 분류하기 1 | 프로그래머스 스쿨 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr 🔍문제 설명[대장균의 크기에 따라 분류하기 1]대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다. 다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온..

코딩테스트 2025.02.17

YOLO 모델을 활용한 문서 내 표 탐지

1. 프로젝트 배경OCR을 활용하여 문서의 텍스트를 추출하는 모델 개발 중, 목표 텍스트가 중복해서 나오고, 다른 불필요한 정보들도 너무 많아 텍스트 추출 성능에 문제점이 발생했다. 문제를 해결하기 위해 고민하던중, 문서에서 중요한 정보가 표(Table) 형태로 정리되어 있음을 확인했고, 표 내부 텍스트로 텍스트 추출 범위를 좁혀 정확도를 개선하고자 했다. 이를 위해 YOLO v8(Object Detection)을 활용하여 문서 내 표 영역을 탐색하는 모델을 만들었다. 2. YOLO v8을 선택한 이유는?1) 객체 탐지 정확도- YOLO 버전이 높아지면서, 객체탐지 성능 비교표에 상위권에 존재한다는 그래프를 보게되었다.YOLOv8은 Anchor-Free 구조를 활용하여 표의 크기나 문서 레이아웃이 ..

업무 스토리북 2025.01.06

AARRR 프레임워크 접근법

1. INTRO스타트업과 디지털 제품 환경에서 AARRR 프레임워크는 사용자의 여정을 다섯 단계로 나누어 제품의 성장 전략을 설계하는 데 활용됩니다. 이를 통해, 사용자 행동을 기반으로 문제 진단과 개선점을 찾을 수 있습니다. 2. AARRR 프레임워크란 Acquisition (획득)Activation (활성화)Retention (유지)Referral (추천)Revenue (수익) AARRR 프레임워크를 통해 사용자의 전환 흐름을 구조적으로 파악할 수 있고, 분석가는 각 단계에서 병목 지점을 파악하고 가설을 수립하여 실험과 개선으로 이어질 수 있도록 데이터 기반 전략을 설계합니다. 3. 각 단계별 분석 포인트 1) Acquisition – 유입- 정의: 사용자가 우리 제품/서비스를 처음 접하게 되는 경로..

데이터 분석 2024.12.12

머신러닝 기반 추천 알고리즘

기존의 메모리 기반 방법론(고전적 추천 알고리즘)은 단순하지만 확장성이 낮고, 계산 시간이 오래 걸릴 수 있습니다. 이를 극복하기 위해 머신러닝 기반 추천 시스템이 활용됩니다. 1. 트리 기반 모델:- 트리 기반 모델은 주어진 입력 피처에 대하여 일련의 결정 규칙을 생성하는 알고리즘- 단순한 구조로 다소 부족한 일반화 성능을 가짐. 단일 모델로 과적합 가능성이 높음- 어떻게 하면 더 효과적인 모델을 만들 수 있을까?=> 앙상블 모델을 사용하자 1-1. 앙상블1) 앙상블이란- 다수의 모델을 구성해 에러를 줄이는 것다수의 모델을 조합하여 사용한다면 개별적인 알고리즘이 가진 장점을 더하고 단점을 보완할 수 있음 2) 고려해야할 점 1) 어떻게 충분한 다양성을 보장할까?2) 개별 모델을 어떻게 취합할까? 3) ..

휘트의 데이터 일지

전체 글 21

티스토리툴바

« 2026/04 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30