전체 글 21

SQL 코딩테스트 연습_프로그래머스_Level2 / 재구매가 일어난 상품과 회원 리스트 구하기

https://school.programmers.co.kr/learn/courses/30/lessons/131536 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr 🔍문제 설명[재구매가 일어난 상품과 회원 리스트 구하기]다음은 어느 의류 쇼핑몰의 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 ONLINE_SALE_ID, USER_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.(동일한 날짜, 회원 ID, 상품 I..

코딩테스트 2025.02.21

SQL 코딩테스트 연습_프로그래머스_Level2 / 조건에 맞는 개발자 찾기

https://school.programmers.co.kr/learn/courses/30/lessons/276034 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr 🔍문제 설명[조건에 맞는 개발자 찾기]SKILLCODES 테이블은 개발자들이 사용하는 프로그래밍 언어에 대한 정보를 담은 테이블입니다. SKILLCODES 테이블의 구조는 다음과 같으며, NAME, CATEGORY, CODE는 각각 스킬의 이름, 스킬의 범주, 스킬의 코드를 의미합니다.스킬의 코드는 2진수로 표현했을 때 각 bit로 구분될 수 있도록 2의 제곱수로 구성되어 있습니다.DEVELOPERS 테이블은 개발자들의 프로그래밍 스킬 정보..

코딩테스트 2025.02.20

SQL 코딩테스트 연습_프로그래머스_Level3 / 대장균들의 자식의 수 구하기

https://school.programmers.co.kr/learn/courses/30/lessons/299305 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr 🔍문제 설명[대장균들의 자식의 수 구하기]대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ..

코딩테스트 2025.02.20

SQL 코딩테스트 연습_프로그래머스_Level3 / 대장균의 크기에 따라 분류하기 1

코딩테스트 연습 - 대장균의 크기에 따라 분류하기 1 | 프로그래머스 스쿨 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr 🔍문제 설명[대장균의 크기에 따라 분류하기 1]대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다. 다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온..

코딩테스트 2025.02.17

YOLO 모델을 활용한 문서 내 표 탐지

1. 프로젝트 배경OCR을 활용하여 문서의 텍스트를 추출하는 모델 개발 중, 목표 텍스트가 중복해서 나오고, 다른 불필요한 정보들도  너무 많아 텍스트 추출 성능에 문제점이 발생했다.  문제를 해결하기 위해 고민하던중, 문서에서 중요한 정보가 표(Table) 형태로 정리되어 있음을 확인했고, 표 내부 텍스트로 텍스트 추출 범위를 좁혀 정확도를 개선하고자 했다. 이를 위해 YOLO v8(Object Detection)을 활용하여 문서 내 표 영역을 탐색하는  모델을 만들었다. 2. YOLO v8을 선택한 이유는?1) 객체 탐지 정확도- YOLO 버전이 높아지면서, 객체탐지 성능 비교표에 상위권에 존재한다는 그래프를 보게되었다.YOLOv8은 Anchor-Free 구조를 활용하여 표의 크기나 문서 레이아웃이 ..

업무 스토리북 2025.01.06

AARRR 프레임워크 접근법

1. INTRO스타트업과 디지털 제품 환경에서 AARRR 프레임워크는 사용자의 여정을 다섯 단계로 나누어 제품의 성장 전략을 설계하는 데 활용됩니다. 이를 통해, 사용자 행동을 기반으로 문제 진단과 개선점을 찾을 수 있습니다. 2. AARRR 프레임워크란 Acquisition (획득)Activation (활성화)Retention (유지)Referral (추천)Revenue (수익) AARRR 프레임워크를 통해 사용자의 전환 흐름을 구조적으로 파악할 수 있고, 분석가는 각 단계에서 병목 지점을 파악하고 가설을 수립하여 실험과 개선으로 이어질 수 있도록 데이터 기반 전략을 설계합니다. 3. 각 단계별 분석 포인트 1) Acquisition – 유입- 정의: 사용자가 우리 제품/서비스를 처음 접하게 되는 경로..

데이터 분석 2024.12.12

머신러닝 기반 추천 알고리즘

기존의 메모리 기반 방법론(고전적 추천 알고리즘)은 단순하지만 확장성이 낮고, 계산 시간이 오래 걸릴 수 있습니다. 이를 극복하기 위해 머신러닝 기반 추천 시스템이 활용됩니다. 1. 트리 기반 모델:- 트리 기반 모델은 주어진 입력 피처에 대하여 일련의 결정 규칙을 생성하는 알고리즘- 단순한 구조로 다소 부족한 일반화 성능을 가짐. 단일 모델로 과적합 가능성이 높음- 어떻게 하면 더 효과적인 모델을 만들 수 있을까?=> 앙상블 모델을 사용하자 1-1. 앙상블1) 앙상블이란- 다수의 모델을 구성해 에러를 줄이는 것다수의 모델을 조합하여 사용한다면 개별적인 알고리즘이 가진 장점을 더하고 단점을 보완할 수 있음 2) 고려해야할 점 1) 어떻게 충분한 다양성을 보장할까?2) 개별 모델을 어떻게 취합할까? 3) ..

유사도 계산

추천 시스템에서 유사도 계산은 매우 중요한 단계입니다. 유사도를 계산하는 방법에는 다양한 수학적 방법이 있으며, 각 방법은 데이터의 특성과 상황에 따라 적합성이 달라집니다. 아래에서는 대표적인 유사도 계산 방법을 소개하고 자세히 설명하겠습니다. 1. 코사인 유사도 (Cosine Similarity)개념코사인 유사도는 두 벡터 간의 방향의 유사도를 측정합니다. 두 벡터가 이루는 각도의 코사인을 계산하여 유사도를 나타냅니다.값의 범위: -1(반대 방향) ~ 1(같은 방향)보통 추천 시스템에서는 값이 0에서 1 사이로 나타납니다.공식예시아이템 간 유사도를 계산:# 아이템 피처 행렬 초콜릿 | 견과류 | 짠맛아몬드빼빼로 1 | 1 | 0오징어땅콩 ..

컨텐츠 기반 필터링과 협업 필터링

1. 내가 느끼는 필터링들의 느낌컨텐츠 기반 필터링 : "너 그거 좋아했으니깐, 그거랑 비슷한 이것도 좋아할거야!”협업 필터링 : “너가 좋아했던 그거, 그거 좋아하는 애들은 이것도 좋아하던데?”2. 컨텐츠 기반 필터링2.1 개념컨텐츠 기반 필터링은 사용자가 좋아했던 아이템과 비슷한 특성을 가진 아이템을 추천하는 방식입니다.1.2 주요 과정특성 추출: 아이템을 설명할 수 있는 피처(예: 가격, 카테고리, 성분 등)를 수치 형태로 변환합니다.유사도 계산: 코사인 유사도, 유클리드 거리, 피어슨 상관계수 등을 활용해 아이템 간의 유사도를 측정합니다.추천: 유사도가 높은 아이템을 사용자가 선호할 가능성이 높은 순으로 추천합니다.1.3 장단점장점:적은 상호작용 데이터에도 활용 가능 (Cold Start 문제 일..

고전적인 추천 알고리즘: 연관 규칙 기반 추천 (Association Rule Mining)

추천 시스템은 다양한 알고리즘을 기반으로 작동하지만, 그중에서도 **연관 규칙 기반 추천(Association Rule Mining)**은 단순하면서도 강력한 고전적인 추천 방식 중 하나입니다. 이번 글에서는 연관 규칙 기반 추천의 개념, 주요 용어, 성능 지표, 알고리즘 등을 다루어 보겠습니다. 1. 연관 규칙 기반 추천이란?연관 규칙 기반 추천은 거래 데이터를 분석하여 "A를 산 사람은 B도 산다"라는 규칙을 발견하고, 이를 바탕으로 추천을 제공하는 기법입니다.예를 들어:"기저귀를 샀던 김 씨는 맥주도 샀다. 당신도 기저귀를 샀으니 맥주를 사는 게 어떨까요?"이 기법은 Market Basket Analysis 또는 Affinity Analysis로도 불리며, 다음과 같은 특징을 가집니다:특정 도메인에..