-
- [연구] 박호건 교수 연구실 (LearnData Lab)의 그래프 신경망 연구 WSDM 2025 논문 게재 승인 (석사졸업: 박종원, 박사과정: 정희수) NEW
- 박호건 교수 연구실 (LearnData Lab)의 그래프 신경망 연구 WSDM 2025 논문 게재 승인 (석사졸업: 박종원, 박사과정: 정희수) LearnData연구실 (지도교수: 박호건)의 논문이 인공지능 분야 최우수학회인 The 18th ACM International Conference on Web Search and Data Mining에 게재 승인(Accept) 되었습니다. 1. 논문 “CIMAGE: Exploiting the Conditional Independence in Masked Graph Auto-encoders” 은 인공지능학과 박종원 (석사졸업생)이 제1저자로 게재하였으며, 소프트웨어학과 정희수 (박사과정)이 공동 1저자로 참여했습니다. 성균관대학교의 박호건 교수 연구진은 자기 지도 학습(Self-Supervised Learning)을 기반으로 하는 그래프 신경망(GNN) 학습 기술 연구에서 높은 수준의 성과를 달성했습니다. 이번 연구는 CIMAGE (Conditional Independence Aware Masked Graph Auto-Encoder) 라는 모델을 개발하여, 기존의 무작위 마스킹 방식이 가진 한계를 극복하고 그래프 신경망의 표현력을 한층 더 강화하였습니다. CIMAGE 모델은 조건부 독립성(Conditional Independence)을 활용해 마스킹 전략을 설계하며, 이를 통해 그래프 표현 학습의 효율성과 정확도를 크게 높였습니다. 특히, 이번 연구에서는 높은 신뢰도의 가짜 레이블을 사용하여 두 가지 독립된 맥락을 생성하고, 이를 통해 마스킹과 재구성 작업을 수행하는 새로운 사전 학습(pretext task) 방법을 제안하였습니다. CIMAGE의 성능은 다양한 그래프 벤치마크 데이터셋에서 우수함을 입증했으며, 노드 분류 및 링크 예측과 같은 다운스트림 작업에서 높은 정확도를 기록하며, 그래프 표현 학습 분야의 새로운 기준을 제시하고 있습니다. 이 연구는 성균관대학교의 혁신적이고 선도적인 연구 방향을 보여주는 중요한 성과로, 그래프 신경망 연구 및 자율 학습 분야에서 널리 활용될 가능성이 높습니다. LearnData 연구실은 그래프, 자연어, 센서, 이미지 등 다양한 모달리티를 활용한 기계학습 및 데이터마이닝 기술 개발, 설명 가능 AI 기술 연구 등을 수행하고 있습니다. 이번 WDSM 2025 논문의 연구는 인공지능대학원, 정보통신기획평가원, 한국콘텐츠진흥원 등의 지원으로 진행되었습니다. 박호건 | hogunpark@skku.edu | LearnData Lab | https://learndatalab.github.io
-
- 작성일 2024-12-02
- 조회수 36
-
- [연구] [엄영익 교수] 분산컴퓨팅연구실, (문성재 석박통합과정 2기) SIGMOD 2025 논문 게재 승인
- [엄영익 교수] 분산컴퓨팅연구실, (문성재 석박통합과정 2기) SIGMOD 2025 논문 게재 승인 분산컴퓨팅연구실 (지도교수: 엄영익)의 문성재 (공동 1 저자, 석박통합과정 2기)의 논문이 데이터베이스 분야의 Top-tier 국제학술대회인 SIGMOD 2025 (ACM SIGMOD/PODS International Conference on Management of Data)에 게재 승인(Accept)되었습니다. 해당 논문은 2025년 6월에 독일 Berlin에서 발표될 예정입니다. [논문 정보] 제목: Boosting OLTP Performance with Per-Page Logging on NVDIMM 저자: 문성재, 이보현, 박종혁, 이상원 학회: ACM SIGMOD/PODS International Conference on Management of Data (SIGMOD 2025) [연구 내용] 플래시 SSD 기반의 관계형 DBMS가 OLTP 워크로드를 수행하는 경우, 작은 크기의 빈번한 업데이트는 DRAM에서 SSD로의 페이지 쓰기를 발생시켜 트랜잭션 처리량을 크게 제한합니다. 이 문제를 해결하기 위해 본 논문에서는 비휘발성 메모리 종류 중 하나인 NVDIMM (Non-Volatile DIMM)을 내구성 로그 캐시로 활용하여 DRAM에서 SSD로의 페이지 쓰기를 흡수하는 NV-PPL이라는 새로운 데이터베이스 아키텍처를 제안합니다. NV-PPL은 페이지 업데이트로 생성된 redo log를 캡처하여 소량의 NVDIMM에 페이지 별 업데이트 로그 (Per-Page Log, PPL)만 저장하여 SSD로의 페이지 쓰기 없이 데이터 내구성을 보장하며, System Failure로 인한 복구 시 PPL로 내구성이 보장된 페이지들은 Redo 및 Undo 과정을 회피하여 복구과정에서 발생하는 SSD로의 페이지 읽기/쓰기를 크게 감소시킵니다. 또한 PPL을 활용한 redo-based multi-versioning과 기존의 undo-based 방식을 결합한 Hybrid version reconstruction 방식을 통해 HTAP 환경에서 발생하는 undo-chaining에 의한 buffer pollution 문제를 해결하여 페이지 읽기/쓰기를 줄이고 Buffer Hit ratio를 높입니다. NV-PPL을 MySQL/InnoDB 엔진에 구현하여 실제 NVDIMM 장치에서 실험해 본 결과, 동일한 가격의 Vanilla MySQL에 비해 페이지 쓰기를 79%를 줄여 트랜잭션 처리량이 8.7배 향상되었으며, 페이지 단위 NVDIMM 캐싱 방식인 NV-SQL 대비 페이지 쓰기를 59%를 줄여 트랜잭션 처리량이 1.5배 향상되었음을 확인했습니다. 그리고 Vanilla MySQL 대비 복구 시간을 1/3로 줄였으며 HTAP 워크로드에서 Long-Lived Transaction(LLT)의 지연 시간을 최소 3배에서 최대 18배까지 개선했습니다.
-
- 작성일 2024-11-05
- 조회수 718
-
- [연구] [차수영 교수] 소프트웨어분석연구실(SAL), ICSE 2025 논문 게재 승인
- [차수영 교수] 소프트웨어분석연구실(SAL), ICSE 2025 논문 게재 승인 소프트웨어 분석 연구실 (지도교수: 차수영)의 이재혁 학생 (석사과정)의 논문이 소프트웨어공학 분야 최우수 학회인 ICSE 2024 (IEEE/ACM International Conference on Software Engineering)에 게재 승인(Accept) 되었습니다. 해당 논문은 2025년 4월에 캐나다 Ottawa에서 발표될 예정입니다. 본 논문 "TopSeed: Learning Seed Selection Strategies for Symbolic Execution from Scratch"은 대표적인 소프트웨어 테스팅 방법 “기호 실행(Symbolic Execution)”의 성능을 높이기 위해, 사전 지식 없이 좋은 “시드(Seed)”를 선택하는 전략을 제안한다. 기호 실행에서 “시드”는 비싼 SMT 풀이 비용 없이, 테스트할 프로그램의 코드를 효과적으로 탐험할 수 있도록 도움을 주는 역할을 한다. 그러나, 대부분의 최신 기호실행 기술들은 시드를 사용하지 않고 그 성능을 높이는데 초점을 맞추었다. 본 논문에서는 다양한 최신 기호 실행 기술들이 사전 지식 없이 좋은 시드를 선택할 수 있도록 도와주는 상호 보완적인 방법인 TopSeed를 제안한다. 실험적으로, TopSeed는 다수의 오픈소스-C 프로그램들에 대해 다양한 최신 기호 실행 기술들의 성능을 분기 커버리지(Branch Coverage)와 오류 검출 관점에서 크게 향상시키는데 성공하였다. [논문 정보] 제목: TopSeed: Learning Seed Selection Strategies for Symbolic Execution from Scratch 저자: 이재혁, 차수영 학회: IEEE/ACM International Conference on Software Engineering (ICSE 2025) Abstract: We present TopSeed, a new approach that automatically selects optimal seeds to enhance symbolic execution. Recently, the performance of symbolic execution has significantly improved through various state-of-the-art techniques, including search strategies and state-pruning heuristics. However, these techniques have typically demonstrated their effectiveness without considering “seeding”, which efficiently initializes program states for exploration. This paper aims to select valuable seeds from candidate inputs generated during interactions with any symbolic execution technique, without the need for a predefined seed corpus, thereby maximizing the technique's effectiveness. One major challenge is the vast number of candidates, making it difficult to identify promising seeds. To address this, we introduce a customized online learning algorithm that iteratively groups candidate inputs, ranks each group, and selects a seed from the top-ranked group based on data accumulated during symbolic execution. Experimental results on 17 open-source C programs show that TopSeed significantly enhances four distinct cutting-edge techniques, implemented on top of two symbolic executors, in terms of branch coverage and bug-finding abilities.
-
- 작성일 2024-11-04
- 조회수 655
-
- [연구] [고영중 교수] 자연어처리연구실(NLP lab), EMNLP 2024 논문 게재 승인(2편)
- [고영중 교수] 자연어처리연구실(NLP lab), EMNLP 2024 논문 게재 승인(2편) 자연어처리연구실(NLP lab, 지도교수: 고영중)의 논문 2편이 인공지능 및 자연어처리 분야의 Top-tier 국제학술대회인 EMNLP 2024(The 2024 Conference on Empirical Methods in Natural Language Processing)의 Industry Track에 게재 승인되었습니다. 각 연구는 NAVER, NC Soft와 산학 협력을 통해 이루어졌습니다. 논문#1 Hyper-QKSG: Framework for Automating Query Generation and Knowledge-Snippet Extraction from Tables and Lists (인공지능학과 박사과정 김두영, 인공지능학과 석사과정 장윤진, NAVER 산학) 논문 요약: 본 연구에서는 지식스니펫의 커버리지를 자동으로 확장하는 프레임워크를 제안합니다. 지식스니펫이란 검색엔진에서 검색 결과 상단에 위치하는 짧은 단락으로, 사용자가 쿼리에 대한 정보를 검색된 문서를 읽을 필요 없이 얻을 수 있도록 편의성을 제공하는 역할을 합니다. 테이블이나 리스트와 같이 복잡한 웹 문서구조에서 지식스니펫을 추출하기 위해서, 기존의 자연어 텍스트 기반의 언어모델을 HTML 기반의 언어모델으로 재학습하였으며, 문서로부터 쿼리와 지식스니펫을 추출하는 파이프라인 시스템을 구축하였습니다. 또한 본 연구에서 자동으로 지식스니펫의 커버리지를 확장하는 과정에서 생성되는 다양한 노이즈 지식스니펫-쿼리 쌍에 대해서 필터링 및 개선 방법을 제안하였습니다. 실제 검색 환경에서 자동 확장된 지식스니펫 데이터베이스를 기반으로 정성평가를 진행한 결과 반환된 지식스니펫이 사용자 쿼리에 대해 유용한 정보를 제공할 수 있음을 보였으며, 기존에 테이블이나 리스트에서 지식스니펫을 뽑지 못하는 한계를 극복하고 다양한 HTML 구조에서 지식스니펫을 추출하여 정보를 제공할 수 있음을 보였습니다. Abstract: These days, there is an increasing necessity to provide a user with a short knowledge-snippet for a query in commercial information retrieval services such as the featured snippet of Google. In this paper, we focus on how to automatically extract the candidates of query-knowledge snippet pairs from structured HTML documents by using a new Language Model (HTML-PLM). In particular, the proposed system is powerful on extracting them from Tables and Lists, and provides a new framework for automate query generation and knowledge-snippet extraction based on a QA-pair filtering procedure including the snippet refinement and verification processes, which enhance the quality of generated query-knowledge snippet pairs. As a result, 53.8% of the generated knowledge-snippets includes complex HTML structures such as tables and lists in our experiments of a real-world environments, and 66.5% of the knowledge-snippets are evaluated as valid. 논문#2 RAC: Retrieval-augmented Conversation Dataset for Open-domain Question Answering in Conversational Settings (인공지능학과 박사과정 최봉근, 인공지능학과 석박통합과정 박정재, NC Soft 산학) 논문 요약: “RAC: Retrieval-augmented Conversation Dataset for Open-domain Question Answering in Conversational Settings” 논문은 NC Soft와 산학 협력을 통해 구축한 데이터셋을 소개합니다. 해당 데이터셋은 검색 기반의 대화형 질의응답 문제를 다루고 있으며, 구체적으로 대화 문맥 내에서 사용자의 질문에 대한 사실 기반의 응답을 하기 위해 문맥 기반의 질의 재작성, 문서 검색, 문서 재순위화, 응답 생성의 과정을 포함하고 있습니다. 특히, 기존의 대화형 질의응답 데이터들이 검색된 문서 내의 일부 단어 혹은 문장을 추출하여 응답으로 사용하는 반면, 검색된 문서를 반영하여 사람과 같은 자연스러운 응답을 생성할 수 있는 것을 목표로 하고 있습니다. 본 논문에서는 데이터셋과 함께 BM25와 한국어 Dense Retriever을 기반으로 한 문서 검색 성능 및 Ko-BART와 LLM(GPT-4o-mini)을 기반으로 한 응답 생성 성능을 Baseline으로 제공하고 있습니다. Abstract: In recent years, significant advancements in conversational question and answering (CQA) have been driven by the exponential growth of large language models and the integration of retrieval mechanisms that leverage external knowledge to generate accurate and contextually relevant responses. Consequently, the fields of conversational search and retrieval-augmented generation (RAG) have obtained substantial attention for their capacity to address two key challenges: query rewriting within conversational histories for better retrieval performance and generating responses by employing retrieved knowledge. However, both fields are often independently studied, and comprehensive study on entire systems remains underexplored. In this work, we present a novel retrieval-augmented conversation (RAC) dataset and develop a baseline system comprising query rewriting, retrieval, reranking, and response generation stages. Experimental results demonstrate the competitiveness of the system and extensive analyses are conducted to apprehend the impact of retrieval results to response generation. 고영중 교수: yjko@skku.edu, nlp.skku.edu, 자연어처리연구실: nlplab.skku.edu
-
- 작성일 2024-10-04
- 조회수 1120
-
- [연구] [우홍욱 교수] CSI 연구실, NeurIPS 2024 논문 게재 승인 (3편)
- [우홍욱 교수] CSI 연구실, NeurIPS 2024 논문 게재 승인 (3편) CSI연구실 (지도교수: 우홍욱)의 3편의 논문이 인공지능 분야 우수학회인 NeurIPS 2024 (Thirty-Eighth Annual Conference on Neural Information Processing Systems) 에 게재 승인(Accept) 되었습니다. 논문은 24년12월 캐나다 벤쿠버에서 발표될 예정입니다. 1. 논문 “LLM-based Skill Diffusion for Zero-shot Policy Adaptation” 은 소프트웨어학과 김우경 (박사과정), 이영석 (박사과정), 김주영 (학사과정) 연구원이 저자로 참여했습니다. 최근 계층적 스킬 기반 정책 학습 방법이 순차적 의사 결정 문제에 대응하는 데 인기를 얻은 반면, 해당 접근 방법은 다양한 자연어로 명시된 사용자의 요구사항에 제로샷(Zero-shot)으로 적응하는 데에는 한계가 있었습니다. 본 연구에서는 LLM의 코드 생성 능력과 손실함수로 제어 가능한 확산 모델(Diffusion Model)을 활용하여, 자연어로 명시된 컨텍스트에 제로샷 적응이 가능한 LDuS (LLM-based Skill Diffusion) 프레임워크를 제안합니다. LDuS는 도메인 변화가 심한 다중 모달리티 로봇 동작 환경에서, 기존의 모방 학습보다 우수한 적응성을 지닙니다. 2. 논문 “Exploratory Retrieval-Augmented Planning For Continual Embodied Instruction Following” 은 소프트웨어학과 유민종 (석박통합과정), 장진우 (석박통합과정) 연구원이 저자로 참여했습니다. 본 연구는 Non-stationary 물리 환경에서 하나가 아닌 여러 개의 지속적인 사용자 지시(Multiple Continuous Instruction Following)를 수행하는 임베디드 에이전트를 위한 탐색 기반 검색 증강 계획 (Exploratory Retrieval-Augmented Planning, ExRAP) 프레임워크를 제안합니다. 이 프레임워크는 최신 LLM의 추론 능력을 활용하여 에이전트가 동적이고 변화하는 환경에서 실시간으로 지시를 수행할 수 있도록 합니다. 이 과정에서 ExRAP은 환경 정보 메모리를 활용하여, 에이전트가 다중 지시의 조건을 이해하고, 이러한 조건에 맞추어 작업을 자원 효율적으로 계획하고, 물리 환경 특성에 맞추어 실행할 수 있습니다. 또한, 물리 환경과의 상호작용을 최소화하는 태스크 수행을 위하여, 정보 기반 환경 탐색을 통합적으로 수행합니다. 이를 통해, 환경 정보의 유효성을 보장하고 전체적인 에이전트의 작업 성능을 향상시킵니다. 3. 논문 “Incremental Learning of Retrievable Skills For Efficient Continual Task Adaptation” 은 소프트웨어학과 이대희 (석박통합과정), 유민종 (석박통합과정), 김우경 (박사과정), 최원제 (박사과정)연구원이 저자로 참여했습니다. 본 논문은 로봇 어플리케이션의 평생 모방학습 (Continual Imitation Learning, CiL)에서 발생하는 세 가지 주요 문제를 다룹니다: 1) long-horizon 환경에서의 전문가 데모 수집의 높은 비용과 비효율성, 2) 비정형적인 동적 환경에서의 적응력, 3) 개인정보 보호를 위한 Unlearning. 해당 연구는 프로토타입 기반 스킬 증분 학습을 통해 저수준 스킬을 이산적인 프로토타입으로 표현하고, 이를 통해 에피소드 재생 없이 행동 지식의 순방향 및 역방향 전이를 향상시키며, 비정형적인 CiL 환경에서 효율적인 작업 적응과 작업에 대한 즉각적인Unlearning을 가능하게 하는 IsCiL (Incremental skills for continual imitation learning) 프레임워크를 제안합니다. Franka-Kitchen과 Meta-World 실험을 통해 IsCiL프레임워크는 새로운 작업에 대한 적응력과 unlearning 시나리오에서의 기능적 특성을 입증하며, 기존 방법들보다 우수한 성능을 보였습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습, LLM 활용을 통해, (1) 체화형 에이전트 (Embodied Agent) (2) 평생학습 성장향 에이전트 (Lifelong Learning Agent) (3) 드론, 클라우드, 자율주행 시스템 최적화 연구를 수행하고 있습니다. 이번 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, BK21 FOUR 사업(BK21), 삼성전자 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-09-30
- 조회수 1388
-
- [연구] [우홍욱 교수] CSI 연구실, EMNLP 2024 논문 게재 승인
- [우홍욱 교수] CSI 연구실, EMNLP 2024 논문 게재 승인 CSI연구실 (지도교수: 우홍욱)의 논문이 인공지능 분야 우수학회인 EMNLP 2024 (The 2024 Conference on Empirical Methods in Natural Language Processing) 에 Findings 게재 승인(Accept) 되었습니다. 논문은 24년 11월 미국 플로리다에서 발표될 예정입니다. 논문 “LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble” 은 소프트웨어학과 신상우 (석사졸업), 이유정 (석사과정) 이 제1저자로 참여했으며, 아크릴 박외진 C박사가 공저자로 참여했습니다. 본 연구는 로봇 에이전트와 사용자간 명령형 대화에 기반하여 지시된 태스크 (Embodied Instruction-Following, EIF)를 수행할 때, 초거대언어모델 (LLM)을 활용하여 시공간적 일관성과 물리 환경에 기반한 보상(Reward)을 구성하는 CoREN(consistency-guided reward ensemble framework) 기법을 제안합니다. CoREN은 추가적인 환경 상호작용 없이 오프라인 데이터를 활용하여, LLM을 기반으로 문맥적, 구조적, 시간적 일관성을 갖춘 보상을 생성합니다. 이러한 보상들은 환경 기반 보상으로 조합되어 에이전트의 학습에 활용되며, 에이전트는 지정된 태스크에 맞는 스킬 실행 계획을 효과적으로 수립하고 수행합니다. CoREN은 홈 로봇 에이전트 테스트 환경인 VirtualHome 벤치마크의 실험을 통해, 다양한 EIF 시나리오와 동적 환경 변화에 대해 SOTA 대비 강건한 성능을 낼 수 있음을 보여주었습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 EMNLP 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, BK21 FOUR 사업(BK21), 정보통신기획평가원, 삼성전자 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-09-27
- 조회수 1426
-
- [연구] [황성재 교수] SoftSec 연구실, EMNLP 2024 논문 게재 승인
- [황성재 교수] SoftSec 연구실, EMNLP 2024 논문 게재 승인 SoftSec 연구실 (지도교수 황성재, softsec.skku.edu)의 김준형 학생 (소프트웨어학과 석사과정)의 논문 1편이 자연어 처리 분야의 Top-tier 학술대회인 Conference on Empirical Methods in Natural Language Processing 2024 (EMNLP 2024)에 게재 승인되어 2024년 11월에 발표될 예정입니다. 논문 제목 : “All You Need is Attention: Lightweight Attention-based Data Augmentation for Text Classification” 본 연구에서는 텍스트 분류 모델의 성능을 향상하기 위한 새로운 DA (Data Augmentation) 방법인 LADAM (Lightweight Attention-based Data Augmentation Method)을 제안하였습니다. LADAM은 어텐션 메커니즘을 사용하여 문장 간에 의미상으로 유사한 단어를 교환하는 방식으로, 기존에 존재하는 랜덤 삽입/삭제와 같은 단순한 오퍼레이션 기반의 방법론보다 더 다양하고 원래 문장의 문맥이 유지되는 데이터를 생성합니다. 또한, 기존 DA 방법론과 달리 외부 데이터나 대규모 언어 모델을 필요로 하지 않기 때문에, 성능이 빠르며 사용자가 사용하기 용이합니다. 본 연구에서 LADAM을 다양한 데이터셋에 적용하여 실험해 본 결과, 여러 조건에서 기존의 방법론보다 높은 성능을 보였습니다. Abstract: This paper introduces LADAM, a novel method for enhancing the performance of text classification tasks. LADAM employs attention mechanisms to exchange semantically similar words between sentences. This approach generates a greater diversity of synthetic sentences compared to simpler operations like random insertions, while maintaining the context of the original sentences. Additionally, LADAM is an easy-to-use, lightweight technique that does not require external datasets or large language models. Our experimental results across five datasets demonstrate that LADAM consistently outperforms baseline methods across diverse conditions.
-
- 작성일 2024-09-27
- 조회수 1127
-
- [연구] [우사이먼성일 교수] DASH 연구실, CIKM 2024 국제 학술대회 논문 2편 개제 승인
- [우사이먼성일 교수] DASH 연구실, CIKM 2024 국제 학술대회 논문 2편 개제 승인 1. (딥페이크 탐지) IDENTIFY: Integral Radial and Spatial Fourier Analysis for AI-Generated Image Authentication (full paper) 저자: Inzamamul Alam (소프트웨어학과 박사과정), Muhammad Shahid Muneer (소프트웨어학과 박사과정), and Simon S. Woo (인공지능대학원/소프트웨어학과) 본 연구에서는 새로운 생성형AI (디퓨전)기법으로 생성된 딥페이크를 Integral Radial and Spatial Fourier Analysis을 활용하여, 높은 성능으로 탐지하는 연구를 제안합니다. 특히, 본연구에서 제안하는 기법은 기존의 방법들보다 12-28%이상 높은 성능을 보여줍니다. IDENTIFY: Integral Radial and Spatial Fourier Analysis for AI-Generated Image Authentication, Inzamamul Alam, Muhammad Shahid Muneer, and Simon S. Woo*, 33rd ACM International Conference on Information & Knowledge Management (CIKM), Boise, Idaho, USA, October 2024 2. (빅데이터/E-commerce) Deep Journey Hierarchical Attention Networks for Conversion Predictions in Digital Marketing (full paper) 저자: Girim Ban (성균관대학교 석사 졸업/KT NexR), Hyeonseok Yun (KT NexR), Banseok Lee (KT NexR), David Sung (KT NexR), and Simon S. Woo (인공지능대학원/소프트웨어학과) 본 연구에서는 디지털 마케팅에서 유저 conversion prediction을 높일 수 있는 Deep Journey Hierarchical Attention Networks (DJHAN) 제안하여, 디지털 마케팅에서 중요한 Conversion Rate (CVR)과 Return on Ad Spend (ROAS)를 기존에 비해 높이고, 실제 수집된 마케팅 데이터(KT/NasMedia)에 적용하여 높은 성능을 보여주었습니다. Deep Journey Hierarchical Attention Networks for Predictions in Digital Marketing Girim Ban, Hyeonseok Yun, Banseok Lee, David Sung, and Simon S. Woo* 33rd ACM International Conference on Information & Knowledge Management (CIKM), Boise, Idaho, USA, October 2024
-
- 작성일 2024-08-29
- 조회수 1004
-
- [연구] [김형식, 우사이먼성일 교수] SecLab/ DASH Lab, CIKM 2024 학술대회 논문 게재 승인
- [김형식, 우사이먼성일 교수] SecLab/ DASH Lab, CIKM 2024 학술대회 논문 게재 승인 보안공학 연구실(지도교수 김형식, https://seclab.skku.edu/), DASH LAB(지도교수 우사이먼 성일, https://dash-lab.github.io/), 네이버 클라우드 연구진이 공동으로 작성한 논문 "Blind-Match: Efficient Homomorphic Encryption-Based 1:N Matching for Privacy-Preserving Biometric Identification"이 CIKM 2024 (Applied Research track)에서 발표될 예정입니다. 다음은 논문의 개요입니다: 생체 인식은 개인 기기에서 사용자 인증을 위해 흔히 사용되지만, 웹 및 클라우드 환경에서는 도입이 제한적입니다. 생체 데이터가 유출될 경우 변경 또는 폐기가 어렵기 때문입니다. 예를 들어, 2016년 미국 인사관리처 해킹 사건에서는 560만 명의 지문이 도난당했습니다. 이 사건은 서버에서 생체 데이터의 안전한 관리의 중요성을 강조합니다. Blind-Match는 동형 암호를 활용한 효율적이고 프라이버시를 보호하는 1:N 생체 인식 매칭 시스템을 제안합니다. Blind-Match는 동형암호 기반의 최적화된 cosign-similarity 계산 방법을 도입하여, 특징 벡터를 더 작은 부분으로 나누어 처리하는 방식을 사용합니다. 이를 통해 계산 시간을 최소화하면서 데이터 프라이버시를 보장합니다. Blind-Match는 다양한 생체 데이터셋에서 최첨단 방법보다 우수한 성능을 발휘합니다. 예를 들어, LFW 얼굴 데이터셋에서 128차원 특징 벡터로 99.63%의 Rank-1 정확도를 달성하였으며, PolyU 지문 데이터셋에서는 16차원 특징 벡터로 99.55%의 Rank-1 정확도를 보였습니다. 또한, 네이버 클라우드의 FaceSign과 같은 대규모 생체 인식 시나리오에서 6,144개의 생체 샘플을 0.74초 만에 처리하여 실용성을 입증하였습니다. 이 연구는 올해 AAAI '24에 발표된 Blind-Touch를 개선한 연구로 프라이버 보장 생체인식 방법의 SOTA 기술로 많이 활용될 것으로 기대됩니다. Abstract: We present Blind-Match, a novel biometric identification system that leverages homomorphic encryption (HE) for efficient and privacy-preserving 1:N matching. Blind-Match introduces a HE-optimized cosine similarity computation method, where the key idea is to divide the feature vector into smaller parts for processing rather than computing the entire vector at once. By optimizing the number of these parts, Blind-Match minimizes execution time while ensuring data privacy through HE. Blind-Match achieves superior performance compared to state-of-the-art methods across various biometric datasets. On the LFW face dataset, Blind-Match attains a 99.63% Rank-1 accuracy with a 128-dimensional feature vector, demonstrating its robustness in face recognition tasks. For fingerprint identification, Blind-Match achieves a remarkable 99.55% Rank-1 accuracy on the PolyU dataset, even with a compact 16-dimensional feature vector, significantly outperforming the state-of-the-art method, Blind-Touch, which achieves only 59.17%. Furthermore, Blind-Match showcases practical efficiency in large-scale biometric identification scenarios, such as Naver Cloud’s FaceSign, by processing 6,144 biometric samples in 0.74 seconds using a 128-dimensional feature vector.
-
- 작성일 2024-07-30
- 조회수 1159
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 다음 페이지로 이동하기
- 마지막 페이지로 이동하기