Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- programmers
- javascript
- bfs
- SQL 고득점 KIT
- group by
- Dynamic Programming
- 너비 우선 탐색
- level 3
- 파이썬
- select
- Python
- 소프티어
- SQL
- dfs
- DP
- 자바스크립트
- C언어
- 깊이 우선 탐색
- 동적계획법
- 티스토리챌린지
- Java
- join
- Lv. 3
- softeer
- LEVEL 2
- Lv. 2
- 오블완
- 프로그래머스
- Lv. 1
- Lv. 0
Archives
- Today
- Total
몸과 마음이 건전한 SW 개발자
ADSP 데이터분석 준전문가 (1) 본문
- 데이터의 이해
- 데이터와 정보
- 정의
- 재료 혹은 자료
- 특성
- 존재적
- 있는 그대로의 사실
- 홍길동 : 키 183 cm
- 임꺽정 : 키 182 cm
- 강감찬 : 키 184 cm
- 있는 그대로의 사실
- 당위적
- 추론, 추측 등을 위한 근거
- 위 세 명의 평균 키 : 183 cm
- 추론, 추측 등을 위한 근거
- 존재적
- 유형
- 정성, 정량
- 정성적
- 언어, 문자 등
- 정량적
- 도형, 기호, 수치 등
- 정성적
- 정형, 비정형, 반정형
- 정형
- 틀 O
- 연산 O
- 고객 정보 데이터베이스, 온라인 상점의 주문 정보, 직원 관리 시스템 등
- 비정형
- 틀 X
- 연산 X
- 소셜 미디어 게시물, 이메일 본문, 과학 연구 데이터 등
- 반정형
- 형태 O
- 연산 X
- XML, JSON, 이메일 헤더 등
- 정형
- 암묵지, 형식지
- 암묵지
- 서류로 표현하기 어려움
- 경험적인 지식, 직관 노하우 등
- 형식지
- 명확하고 구조화된 정보
- 조직의 정책, 절차, 규정 등
- 공통화, 표출화, 내면화, 연결화 (SECI 모델)
- 공통화(Socialization)
- 개인간 지식 공유 => 조직에서 공통된 지식으로 변환하는 과정
- 경험 공유
- 토론, 면담, 회의 등을 통한 경험 공유와 학습
- 표출화(Externalization)
- 개인 지식을 공유 가능 형태로 변환하는 과정
- 경험, 아이디어, 노하우 등
- 문서, 회의 프레젠테이션 등을 통해 표현
- 내면화(Combination)
- 외부 지식을 통합해서 새로운 지식을 형성하는 과정
- 문서, 데이터베이스, 표준화된 절차 등
- 연결화(Internalization)
- 외부에서 획득한 지식을 개인의 내적 지식으로 변환
- 개인적 지식 확장되는 과정
- 공통화(Socialization)
- 암묵지
- 정성, 정량
- 데이터와 정보
- DIKW 피라미드
- Data
- 오늘(7월 2일) 기온 32.8도, 어제(7월 3일) 기온 31.6도
- Information
- 오늘이 더 덥다.
- Knowledge
- 7월은 여름이라 덥다.
- Wisdom
- 더운 여름에는 에어컨을 틀자.
- Data
- 비트와 바이트
- 1바이트(byte) = 8비트(bit)
- 1킬로바이트(KB) = 1024(byte)
- byte < KB < MB < GB < TB < PB < EB < ZB < YB
- 바킬메기테 // 페엑제요
- 페타 < 엑사 < 제타 < 요타
- DIKW 피라미드
- 정의
- 데이터베이스
- 개요
- 정의
- DB System
- DB (Data-Base)
- 정리된 정보
- DBMS (Data-Base Management System)
- 소프트웨어
- DB (Data-Base)
- DB System
- 특징
- 일반적
- 통합 Data
- 중복 X
- 저장 Data
- 저장매체에 저장
- 공용 Data
- 여러 사용자
- 공동 이용
- 대용량
- 변화 또는 운영 Data
- CUD(Create, Update, Delete)를 통한 데이터 최신화
- 통합 Data
- 다양성
- 정보의 축적 및 전달
- 정보 수집과 저장 => 이해관계자에게 전달
- 기계가독성
- 컴퓨터나 다른 자동화된 시스템이 정보를 처리하고 분석하기 쉽도록 구조화된 형식으로 정보를 제공하는 것
- XML, JSON, CSV 등의 형식
- 검색가능성
- 정보가 효과적으로 검색되고 찾아질 수 있는 특성
- 정보 시스템이나 디지털 콘텐츠에서 사용자가 특정 정보를 쉽게 찾고 접근할 수 있도록 하는 능력
- 원격조작성
- 시스템이나 장치를 원격에서 조작하고 제어할 수 있는 특성
- 사용자가 지리적으로 떨어진 장소에서도 시스템이나 장치를 원격으로 액세스하고 제어할 수 있는 능력
- 정보 이용
- 수집된 정보를 활용하여 의사 결정을 지원하거나 문제 해결에 활용하는 과정
- 정보를 분석하고 해석하여 가치 있는 통찰력을 얻는 과정을 포함
- 정보 관리
- 정보의 수집, 저장, 분석, 전달 및 보존에 대한 체계적인 접근 방법
- 조직이 자산으로서의 정보를 효율적으로 관리하고 활용하기 위한 전략 및 프로세스를 개발하고 실행하는 것을 목표
- 데이터베이스 설계, 정보 시스템 개발, 정보 보안 및 개인 정보 보호, 지식 관리 등을 포함하는 다양한 활동
- 정보 기술 발전
- 정보기술은 컴퓨터 하드웨어, 소프트웨어, 네트워크, 데이터베이스 등과 같은 기술
- 컴퓨터와 인터넷 기술 등의 혁신적인 발전
- 컴퓨팅 성능의 향상, 빅데이터 기술의 발전, 인공지능 및 기계 학습 기술의 발달, 사물인터넷 기술의 진보 등
- 경제적 산업적
- 정보기술의 발전은 산업의 디지털화와 변화를 이끌어내며, 새로운 비즈니스 모델과 기회를 제공
- 정보의 축적 및 전달
- 일반적
- 정의
- 활용
- 기업
- 인하우스 DB
- OLTP
- Online Transaction Processing
- 단순 자동화 중심
- 거래 단위에 초점
- OLAP
- Online Analytical Processing
- 데이터 마이닝 등의 기술 등장
- 분석 중심
- CRM, SCM
- Customer Relationship Management : 고객 관계 관리
- Supply Chain Management : 공급 망 관리
- KMS
- Knowledge Management System
- 지식 경영 시스템
- 지식, 경험, 사례 등을 조합하여 문제 해결
- ERP
- Enterprise Resource Planning
- 기업 내부의 다양한 기능과 프로세스를 통합하여 효율적으로 관리하는 소프트웨어 시스템
- 기업 자원 관리 시스템
- 자재 관리 및 구매 관리, 생산 관리, 품질 관리, 자산 관리, 생산 비용 관리, 판매 및 유통 관리 등
- RTE
- Real Time Enterprise
- 기업이 실시간으로 데이터를 수집, 처리 및 분석하여 즉각적인 의사 결정을 내리고 비즈니스 프로세스를 최적화하는 데 중점
- 실시간 기업
- 실시간 데이터 수집 및 모니터링, 빠른 의사 결정, 생산 공정 최적화, 고객 요구 사항 충족, 품질 관리 및 향상 등
- DW
- Data Warehouse
- 기업이 여러 소스에서 수집한 데이터를 통합, 저장, 분석하는 중앙 데이터 저장소
- 데이터 웨어하우스
- 데이터 통합, 시간 상세성, 주제 지향성, 집계 및 요약, 액세스 및 쿼리, 비즈니스 인텔리 전스 지원 등
- 보통 ETL(Extract, Transform, Load) 과정을 통해 다양한 소스에서 데이터를 추출하고 변환하여 DW에 적재
- DM
- Data Mart
- 특정 부서나 사용자 그룹을 위해 구축된 작은 규모의 데이터 저장소
- 주로 특정 주제나 비즈니스 영역에 관련된 데이터만을 포함
- 일반적으로 DW에서 데이터를 추출하여 세부적으로 가공하거나 필요한 경우 독립적으로 구축
- BI
- Business Intelligence
- 기업이 데이터를 수집, 저장, 분석하여 전략적인 의사 결정을 내리고 비즈니스 성과를 향상시키는 데 사용되는 기술과 프로세스
- 업이 데이터를 수집, 저장, 분석하여 전략적인 의사 결정을 내리고 비즈니스 성과를 향상시키는 데 사용되는 기술과 프로세스
- 비즈니스 인텔리전스
- 데이터 수집 및 통합, 데이터 분석, 시각화 및 대시보드, 실시간 분석, 예측 분석, 자동화된 보고서 등
- EAI
- Enterprise Application Integration
- 기업 내의 다양한 응용 프로그램, 시스템 및 데이터베이스를 통합하여 효율적으로 상호 운용할 수 있도록 하는 기술과 방법론
- 산업
- 제조
- RTE, ERP, DW, CRM, BI
- 금융
- EAI, ERP, e-CRM, DW, EDW(Enterprise Data Warehouse)
- 유통
- CRM, SCM, KMS, 균형성과관리(BSC), 핵심성과지표(KPI), 웹리포팅, 전자태그(RFID)
- 제조
- 사회기반구조
- 물류
- CALS
- Commerce At Light Speed
- CVO, EDI, PORT-MIS, KROIS
- CALS
- 지리
- GIS
- Geographic Information System
- LBS
- Location-Based Service
- SIM
- Spatial Information Management
- GIS
- 교통
- ITS
- 지능형 교통 정보 시스템
- ITS
- 의료
- 교육
- NEIS
- 교육 행정 정보 시스템
- NEIS
- 물류
- 기업
- 개요
- 데이터와 정보
- 종류
- RDB
- 관계형 데이터베이스
- 모델
- 데이터는 테이블(table) 형태로 저장되며, 각 테이블은 레코드(record)로 구성되고, 레코드는 여러 개의 속성(attribute)으로 이루어짐
- 테이블 간의 관계는 외래 키(foreign key)를 사용하여 정의
- 스키마 설계
- 데이터의 구조를 사전에 정의한 스키마(schema)에 따라 저장
- 스키마는 테이블의 구조, 속성의 데이터 유형, 제약 조건 등을 정의
- 데이터의 구조를 사전에 정의한 스키마(schema)에 따라 저장
- 확장성
- 수직적 확장(vertical scaling)을 주로 지원
- 단일 서버의 성능을 향상시키는 방식으로 확장
- 수직적 확장(vertical scaling)을 주로 지원
- 트랜잭션 처리
- ACID 속성(원자성, 일관성, 고립성, 지속성)을 준수
- 데이터의 일관성과 무결성을 보장
- NoSQL
- 비구조화된 데이터나 복잡한 데이터 구조를 저장하고 관리하는 데 유연성을 제공하며, 대규모 데이터 처리와 분산 시스템에서 확장성을 강조
- 모델
- 다양한 데이터 모델
- 대표적으로 키-값 스토어(key-value store), 문서형 데이터베이스(document store), 열 지향 데이터베이스(column-oriented database), 그래프 데이터베이스(graph database) 등
- 비구조화된 데이터나 복잡한 데이터 구조를 처리하는 데 유연성을 제공
- 스키마 설계
- 전통적인 RDB와 달리 NoSQL은 스키마가 유연
- 새로운 필드나 구조를 손쉽게 추가하거나 변경 가
- 전통적인 RDB와 달리 NoSQL은 스키마가 유연
- 확장성
- 수평적 확장(horizontal scaling)을 주로 지원
- 여러 대의 서버에 데이터를 분산하여 처리함으로써 시스템의 성능과 용량을 증가
- 수평적 확장(horizontal scaling)을 주로 지원
- 트랜잭션 처리
- BASE 속성(기본적 가용성, 역변적 일관성, 소폭의 가용성, 유연한 일관성)
- 소프트웨어 수준에서 트랜잭션 처리를 관리
- 계층형
- 네트워크형
- 분산형
- 객체지향
- RDB
- SQL
- DDL
- 정의어
- CREATE
- ALTER
- RENAME
- DROP
- 정의어
- DML
- 조작어
- SELECT
- INSERT
- UPDATE
- DELETE
- 조작어
- DCL
- 제어어
- GRANT
- REVOKE
- 제어어
- TCL
- 트랜젝션 제어어
- COMMIT
- SAVEPOINT
- ROLLBACK
- 트랜젝션 제어어
- DDL
- 구성 요소
- 인스턴스
- 하나의 객체
- 모든 것이 인스턴스가 될 수 있음
- 속성
- 객체를 표현하기 위한 값
- 생년월일, 이름, 키 등
- 엔터티
- 2개 이상의 인스턴스와 1개 이상의 속성
- 데이터 집합
- 메타데이터
- 데이터의 설명을 위한 추가적인 데이터
- 인덱스
- 데이터 저장 시 자동적으로 부여되는 데이터의 이름
- 인스턴스