• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid




File synchronization, Cloud storage, Local mode file, Online mode file, Directory activation ratio, Active file mode change, File mode performance index

1. 서 론

클라우드 파일 동기화 서비스는 로컬 디바이스의 파일과 원격 클라우드 스토리지의 파일 내용을 동일하게 유지해 준다. 파일 동기화 서비스를 이용하면 사용자는 여러 디바이스의 파일을 클라우드 스토리지를 통해 항상 최신 상태로 유지할 수 있고, 백업 기능도 이용할 수 있다. 파일 동기화 서비스가 보편화되면서 로컬 스토리지 용량뿐만 아니라 원격 클라우드 스토리지의 용량도 커지고 두 용량의 차이도 발생했다. 특히, 새로운 디바이스의 로컬 스토리지가 기존 클라우드 스토리지보다 용량이 작은 경우에는 새로운 디바이스가 클라우드 스토리지의 모든 파일을 수용할 수 없는 문제가 발생한다. 로컬 스토리지가 부족해지면, 사용자는 더 이상 필요없는 파일을 삭제함으로써 로컬 스토리지의 가용 공간을 확보해야 한다.

로컬 스토리지의 부족 문제를 해결하기 위해, Dropbox(1)나 OneDrive(2) 같은 상용 클라우드 파일 동기화 서비스는 로컬 모드의 파일을 온라인 모드로 변경하는 기능을 제공한다. 파일의 로컬 모드는 로컬 스토리지와 클라우드 스토리지 양쪽에 내용이 동일하게 동기화된 파일이 존재하는 일반적인 파일 모드이다. 반면에, 온라인 모드 파일은 클라우드 스토리지에만 원본 내용을 유지한다. 로컬 스토리지에는 파일 내용을 삭제하고 속성 정보만 유지한다. 따라서, 온라인 모드 파일의 장점은 로컬 디바이스에서 파일 속성 정보는 유지하면서 파일 내용만 삭제함으로써 로컬 스토리지를 절약할 수 있다. 하지만, 클라이언트가 온라인 모드 파일을 액세스할 때, 먼저 클라우드 스토리지에서 파일 내용 전체를 다운로드하여 로컬 모드로 변경해야하기 때문에, 액세스 지연 시간이 길어질 수 있다는 단점을 갖는다. 파일 크기가 클수록 이러한 온라인 모드 파일을 액세스하는 지연 시간은 더 길어지는 문제가 발생한다. 로컬 모드 파일이 많아지면 로컬 스토리지는 파일 크기만큼 사용되고, 온라인 모드 파일이 많아지면 파일 크기와 상관없이 로컬 스토리지를 절약하는 대신 파일 액세스 지연 시간이 발생한다. 즉, 로컬 스토리지 사용 비율과 파일 액세스 시간은 서로 트레이드오프 관계가 있다.

기존의 파일 동기화 (3-12), 클라우드 스토리지 서비스 (13-15) 및 파일 시스템 관련 연구들은 (16-20) 대규모 사용자들의 대용량 파일 처리를 효율적으로 수행하는 동기화 및 파일 처리 성능 향상 방법에 초점을 맞추고 있고, 동기화된 파일의 온라인 및 로컬 모드 변경 기능 자체를 지원하지 않는다. 일부 상용 클라우드 파일 동기화 서비스들은 파일의 온라인 모드 및 로컬 모드 변경 기능을 제공하고 있지만, 이는 사용자의 요청에 따라 선택된 파일이나 디렉토리를 수동으로 온라인 또는 로컬 모드로 변경한다.

본 논문에서는 디렉토리 활성화 비율에 따라 파일 동기화 시스템이 디렉토리 내 선별한 파일들을 능동적으로 온라인 모드 또는 로컬 모드로 변경하는 능동 파일 모드 변경 메카니즘을 제안하고, 이를 로컬 스토리지 사용율과 파일 액세스 지연 시간을 고려한 성능 지수를 정의하여 분석했다. 능동 파일 모드 변경 메카니즘의 기본 아이디어는 다음과 같다. 먼저 디렉토리 및 파일이 얼마나 활성화된 상태인지를 정량화한 디렉토리 활성화 비율을 정의한다. 정해진 기준 기간 내에 파일을 액세스하면 이 파일의 활성화 비율은 최대값이다. 파일을 액세스하지 않은 상태가 일정 기간을 넘어가면 활성화 비율이 기간에 비례하여 떨어진다. 디렉토리의 활성화 비율은 디렉토리 내 모든 파일들의 활성화 비율의 평균값이다. 동기화 디렉토리 내의 파일들을 액세스하지 않은 상태가 길어질수록 이 디렉토리의 활성화 비율도 낮아진다. 활성화 비율이 낮은 디렉토리 내의 파일들은 로컬 스토리지를 낭비하고 있는 셈이다. 능동 파일 모드 변경 메카니즘은 주기적으로 동기화 디렉토리의 활성화 비율을 모니터링하여, 디렉토리 활성화 비율이 일정 수준 이하로 낮아지면 낭비되는 로컬 스토리지 용량을 확보하기 위해 디렉토리 내의 파일들 중 선별하여 온라인 모드로 변경한다. 온라인 모드로 변경할 파일은 로컬 스토리지 사용 비율과 파일의 마지막 액세스 시간 등을 고려하여 선택한다. 반대로, 동기화 디렉토리 내의 파일들을 자주 액세스할수록 디렉토리 활성화 비율은 높아진다. 능동 파일 모드 변경 메카니즘은 디렉토리의 활성화 비율이 일정 수준 이상 높아지면 디렉토리 내의 온라인 모드 파일들중 선별하여 로컬 모드로 변경한다. 로컬 모드로 변경할 온라인 모드 파일은 로컬 스토리지 사용 비율과 파일 액세스 지연 시간등을 고려하여 선별한다. 실험을 통해 파일 모드 성능 지수를 분석한 결과, 제안하는 능동 파일 모드 변경 메카니즘은 로컬 스토리지 사용 비율과 파일 액세스 지연 시간의 두 가지 측면을 모두 고려했을 때, 디렉토리 활성화 비율에 따라 파일 모드를 로컬 모드와 온라인 모드로 능동적으로 변경함으로써, 기존의 수동 파일 모드 변경 메카니즘과 비교하여 전반적으로 성능을 향상시켰다.

본 논문의 구성은 다음과 같다. 2장에서는 기존의 파일 동기화 메카니즘과 클라우드 파일 시스템에 대해 기술하고 파일 모드 측면에서 분석한다. 3장에서는 본 연구의 기반이 되는 파일 동기화 프레임워크에 대해 소개하고 4장에서는 능동 파일 모드 변경 메카니즘을 기술한다. 5장에서는 파일 모드 변경 메카니즘의 성능을 분석하기 위해 정의한 파일 모드 성능 지수에 대해 기술한다. 6장에서 디렉토리 활성화 및 비활성화 시나리오에 따라 기존의 수동 파일 모드 변경 메카니즘과 제안하는 능동 파일 모드 변경 메카니즘을 각각 이용하여 파일 액세스 실험을 수행하고 그 결과를 파일 모드 성능 지수 관점에서 분석한다. 7장에서는 향후 연구 계획과 함께 본 논문의 결론을 맺는다.

2. 관련 연구

Rsync(3)는 클라이언트와 서버의 파일을 동기화하는 알고리즘이다. Rsync는 특히 두 파일 사이의 공통 부분과 차이나는 바이트를 빠르게 분석하여 차이나는 부분만 전송하는 델타 인코딩을 사용함으로써 동기화를 위한 데이터 전송 비용을 줄이는 장점을 갖는다. Rsync는 리눅스에서 표준 유틸리티로 제공되기도 하고 이를 기반으로 다른 동기화 프로그램들도 개발되었다. 본 논문의 능동 파일 모드 변경 메카니즘도 파일 동기화 부분은 rsync 알고리즘을 참고하여 개발되었다. 하지만, rsync 알고리즘 자체는 온라인 및 로컬 모드 등 파일 모드 관련 기능은 지원하지 않는다.

클라우드 스토리지 같은 원격 노드들 사이에 파일 동기화 성능을 향상시키기 위한 연구들이 진행되어 왔다 (4-9). Andriani 등은 (4) Cloud4NetOrg라고 불리는 클라우드 스토리지 기반의 파일 동기화 아키텍처를 제안했다. 이 연구의 주요 대상은 개인 스토리지가 아닌 기업의 대용량 스토리지를 사용하여 협업하는 사용자들이고, 동기화 성능을 높이기 위해 2단계 캐시와 사설 네트워크(private network)를 구성했다. Drago 등은 (5) 성능 측정 실험과 네트워크 패킷 분석을 통해 상용 클라우드 스토리지 서비스들의 동기화 설계 방식을 분석한 결과를 제시했다. Li 등의 (6) 연구에서는 파일 오퍼레이션 중에서 적은 부분이 자주 수정되는 경우 동기화 성능이 현저하게 저하되는 문제를 발견하고, 이를 해결하기 위해 수정 지연 동기화(update-batched delayed synchronization, UDS) 방법을 제안했다. UDS는 파일들의 수정 이벤트를 감지할 때마다 바로 서버와 동기화를 진행하는 대신, 수정된 데이터의 총량이 정해진 임계값보다 작은 동안 대기한다. 그리고, 수정된 데이터 양이 임계값을 넘을 때만 동기화를 진행하기 때문에 동기화 횟수를 줄이고 성능 저하 문제를 해결했다. Han 등의 (7) 연구에서는 기존의 클라우드 스토리지 서비스들을 통합하여 안전하고 신뢰적인 동기화 방법을 제공하는 MetaSync 방법을 제안했다. MataSync는 파일 수정 내용을 여러 클라우드 서비스들 사이에서 동기화한 결과의 일관성을 유지하기 위해, 기존 Paxos (21) 알고리즘을 클라이언트 기반으로 수정한 pPaxos 알고리즘을 제안하고, 일관성 유지 비용을 줄이는 데이터 복제 알고리즘을 제안했다. Lopez 등은 (8) 경량 메시지 큐 프레임워크인 ObjectMQ를 기반으로 파일 동기화 기능에 필요한 자원의 탄력성을 제공하는 StackSync를 개발했다. 탄력적 파일 동기화는 동기화 작업 수행 비용에 따라 서버나 메시지 큐 객체 등의 자원을 늘리거나 줄이는 등 필요 자원을 효율적으로 제공하는 방법이다. Li 등은 (9) 동기화와 관련된 네트워크 트래픽 사용 효율성 지수(Traffic Usage Efficiency, TUE)를 정의하고, 이 지수를 상용 클라우드 스토리지 서비스들을 대상으로 측정한 결과를 분석하여 동기화 관련 트래픽을 효율적으로 사용할 수 있는 방안을 제시했다. Wang 등은 (10) 사물 인터넷 디바이스들의 데이터 관리와 동기화를 포그 컴퓨팅 서버로 이동함으로써 데이터 보안을 강화하고 클라우드 스토리지의 부하를 줄일 수 있는 새로운 데이터 동기화 방법을 제안했다. 또한, 기존 동기화 알고리즘인 rsync의 동기화 통신 비용을 줄이기 위해, 차등 동기화 알고리즘인 Fog Sync (FSync)를 개발했다. Wickramarachchi 등은 (11) 인터넷을 사용하지 않는 대신 모바일 디바이스를 이벤트 브로커로 사용하여 스토리지들 사이에 궁극적 일관성(eventual consistency)을 유지하는 방법을 제안했다. Zhang 등은 (12) SimpleSync라는 동기화 방법을 제안했다. SimpleSync에서는 기존 rsync 알고리즘이 가진 서버와 클라이언트의 동기화 오버헤드를 줄이는 새로운 알고리즘을 적용하고, 여러 동기화 요청을 병렬 처리하기 위해 Flink 프레임워크를 적용하여 동기화 성능을 향상시켰다. 이처럼 파일 동기화 성능을 향상시키기 위한 여러 방법들이 제안되었으나, 파일 모드 변경이나 이를 통한 로컬 스토리지와 파일 액세스 지연 측면에서의 동기화 성능 연구는 진행되지 않았다. OneDrive, Google Drive 등의 상용 클라우드 스토리지 서비스들은 파일 동기화 방법을 따로 공개하지 않기 때문에, 이들을 분석한 연구들은 (5)(13) 동기화 기능 테스트 실험과 트래픽 분석을 통해 간접적으로 분석하는 방법을 사용했다. 기술 문서에서는 (1)(2)(14) 이들 상용 클라우드 스토리지 서비스의 특징 일부를 기술하고 있다. Dropbox와 OneDrive는 각각 스마트 동기화(Smart Sync)와 파일 온디맨드(Files on Demand)라는 파일 모드 변경 방법을 제공한다. 이 기능들은 원본 파일을 서버에만 저장하고 클라이언트는 파일의 메타 정보만 유지하여 클라이언트 스토리지 공간을 절약하는 방법이다. 하지만, Dropbox와 OneDrive는 사용자가 수동으로 파일들을 선택하고 이들을 온라인 또는 로컬 모드로 변경하도록 하는 한계점을 가지고 있다. Mościcki 등은 (15) 과학, 교육 및 연구 분야 등에서 사용되는 클라우드 동기화 및 공유 서비스 (CS3) 기술의 동향에 대해 기술했다. 클라우드 동기화 서비스의 종류를 일반 사용자 대상과 회사 내의 특수 목적형 서비스로 분류하고, 상호운용성, 애플리케이션, 서비스 관점에서 관련 기술들을 리뷰하고 있다.

이외에도 클라우드 스토리지나 클라우드 파일 시스템의 성능 향상을 위한 연구들도 (16-20) 진행되어 왔다. Bessani 등은 (16) 기존 클라우드 스토리지 시스템의 신뢰성, 내구성, 파일 공유의 비효율성 문제를 해결하기 위해 강한 일관성을 제공하는 공유 클라우드 파일 시스템(Shared Cloud-backed File System, SCFS)을 제안했다. Ghemawat 등은 (17) 대규모 데이터 처리 애플리케이션에 적합한 분산 파일 시스템인 구글 파일 시스템(Google File System, GFS)을 소개했다. 구글 파일 시스템은 저비용 하드웨어를 대상으로 고장감내 기술을 제공하고 대규모 클라이언트들에게 우수한 성능을 제공한다. Muniswamy- Reddy 등은 (18) 클라우드 스토리지에 데이터만이 아니라 데이터의 생성 및 수정 관련 히스토리 메타 정보(Provenance)를 제공하는 방안을 제안했다. 데이터 히스토리 정보는 데이터가 언제 생성되었는지, 어느 선행 데이터들로부터 파생된 것인지 등의 정보를 포함한다. Duan 등은 (19) 대규모 데이터의 관리보다 대규모 개인 사용자의 데이터 관리를 위한 클라우드 스토리지인 CSTORE를 제안했다. CSTORE는 사용자별로 독립적인 네임 스페이스를 제공하여 데이터 보안을 강화하고, 로그 기반으로 같은 사용자의 다중 로그인이나 파일 수정 과정에서의 데이터 충돌을 해결할 수 있도록 했다. Shvachko 등은 (20) 대규모 데이터의 분산 처리 방법에 특화된 하둡 분산 파일 시스템(Hadoop Distributed File System, HDFS)을 기술했다. HDFS는 클러스터로 구성된 수천 대의 서버가 대량의 데이터를 분산 처리 및 저장하고, 대규모 데이터셋을 사용자 애플리케이션에게 빠른 속도로 전송하도록 설계되었다. 이들 연구는 파일 시스템의 성능 향상에 초점을 맞추었지만, 역시 파일의 온라인 및 로컬 모드 변경을 통한 로컬 스토리지와 파일 액세스 지연 문제는 다루지 않았다. 관련 연구의 특징을 표로 정리하면 표1과 같다.

표 1. 관련 연구 비교

Table 1. Comparison of related works

관련 연구

기술 목적

파일모드변경

(4-12)

파일 동기화 성능 향상

N/A

Dropbox(1), OneDrive(2)

상용 클라우드 스토리지

수동 변경

Google Drive(14)

상용 클라우드 스토리지

N/A

(16-20)

클라우드 스토리지 성능 향상

N/A

3. 파일 동기화 프레임워크

이번 장에서는 기존의 통신 프레임워크(Communication Framework, CM)(22)에 모듈로 추가한 rsync 기반으로 개발한 CM 파일 동기화 프레임워크를 기술한다. CM은 클라이언트 서버 구조 애플리케이션 개발에 필요한 여러 가지 응용 레벨 통신 서비스를 제공하는 통신 프레임워크이다. 애플리케이션 개발자는 CM 라이브러리에서 제공하는 애플리케이션 프로그래밍 인터페이스(API)를 이용하여 서버 로그인과 사용자 관리 등 기본적인 서비스뿐만 아니라 파일 전송, 소셜 네트워크 서비스, 메시지 전송 등의 기능들을 간단하게 구현할 수 있다. 특히, CM은 각 통신 서비스별로 다양한 옵션을 API 매개변수와 설정 파일을 통해 제공하기 때문에, 개발자는 애플리케이션 요구사항에 따라 다른 서비스 전략을 선택할 수 있다. 여러 서비스들 중에서 CM 파일 동기화 서비스는 사용자 관리, 파일 전송 등 기존 CM 서비스들과 유기적으로 연결되어 개인 클라우드 스토리지 서비스 개발을 용이하게 해준다. CM 파일 동기화 프레임워크에서 제공하는 파일 동기화 과정은 이전 연구에서 (23) 구체적으로 기술하고 있으며, 본 논문에서는 파일 동기화 서비스 내에서 파일 모드를 능동적으로 변경하는 메카니즘에 초점을 둔다. 파일 동기화는 하나의 클라이언트와 서버 사이에 대해서만 고려하고, 클라이언트의 파일을 기준으로 서버 파일을 동기화하는 단방향 동기화를 대상으로 한다. 양방향 동기화, 같은 클라이언트의 다중 로그인, 및 다른 클라이언트와의 파일 공유 등 확장 기능은 아직 다루지 않는다.파일 동기화 서비스 기본 구조는 그림1과 같다. 클라이언트와 서버 애플리케이션은 각각 하부 통신 프레임워크로 CM을 이용한다. 파일 동기화 공통 모듈은 클라이언트와 서버 양쪽에서 공통으로 사용하는 CM 모듈로써 동기화 관련 세부 처리, 동기화 이벤트 관리, 동기화 및 파일 모드 관련 정보 관리 등을 담당한다. 동기화 디렉토리 모니터링 태스크는 클라이언트 측 CM에서 동기화 디렉토리의 변경사항을 감지하기 위해 별도 스레드로 동작하는 모듈이다. 클라이언트가 동기화를 중지하면, 이 모니터링 태스크가 중지되고, 동기화를 재시작하면 모니터링 태스크가 다시 시작된다. 능동 파일 모드 변경 태스크는 클라이언트 측 CM에서 동기화 디렉토리 활성화 상태에 따라 파일 모드를 능동적으로 변경하는 역할을 담당한다. 파일 모드 변경과 관련된 내용은 다음 장에서 자세히 기술한다. 블록 체크섬 생성 태스크는 서버측 CM에서 별도의 스레드로 동기화 대상 파일을 선별하고 파일별 블록 체크섬을 생성하는 역할을 수행하는 모듈이다. 이 모듈은 클라이언트와 동기화를 수행하는 동안에만 클라이언트별로 생성하여 작동한다. 클라이언트는 서버에 로그인한 후에 파일 동기화 서비스를 시작하거나 중지할 수 있다. 클라이언트가 파일 동기화 서비스를 시작하면, CM은 클라이언트의 동기화 디렉토리 내에 있는 파일들을 서버와 동기화한다. 서버 측 CM은 클라이언트별로 별도의 동기화 디렉토리를 관리한다. 서버와의 동기화가 완료된 후, 클라이언트 CM은 계속 클라이언트의 동기화 디렉토리를 모니터링하며 파일 추가, 수정, 삭제 등의 이벤트가 발생할 때마다 서버와 동기화를 반복한다.

그림. 1. CM 파일 동기화 전체 구조

Fig. 1. Overall structure of CM file synchronization

../../Resources/kiee/KIEE.2023.72.2.241/fig1.png

4. 능동 파일 모드 변경 메카니즘

제안하는 능동 파일 모드 변경 메카니즘의 기본 아이디어는 디렉토리의 활성화 정도를 측정하여 이 값에 따라 파일 모드를 능동적으로 변경하는 것이다. 디렉토리가 활성화되었다는 것은 현재 시간을 기준으로 클라이언트가 이 디렉토리내의 파일들을 자주 액세스한다는 의미이다. 반대로 디렉토리 활성화 정도가 낮아지면 이 디렉토리 내의 파일들을 액세스하는 빈도가 낮다는 의미이다. 파일을 자주 액세스한다면 이 파일은 온라인 모드보다는 로컬 모드로 유지되어야 파일 액세스 시간을 단축할 수 있다. 반면에 파일을 잘 액세스하지 않으면, 이 파일은 액세스하기 전까지 온라인 모드로 유지하면 로컬 스토리지 용량을 절약할 수 있다.

디렉토리의 활성화 정도를 정량화하기 위해 본 논문에서는 디렉토리 내의 파일들이 현재 시간까지 얼마나 액세스되었는지를 나타내는 지표를 디렉토리 활성화 비율(directory activation ratio, DAR)로 정의한다. 디렉토리 활성화 비율은 다시 디렉토리 내 모든 파일들의 활성화 비율(file activation ratio, FAR)의 평균값으로 구한다. 파일 활성화 비율은 다음과 같이 정의한다.

(1)
$FAR=\min\{AT/(T-LAT),\: 1\}(0\le FAR\le 1)$

식(1)에서 T는 현재 시간, LAT는 마지막 액세스 시간을 의미한다. AT는 파일의 마지막 액세스 이후 경과 시간 임계값(Aging Threshold)이다. 이 임계값은 파일을 마지막으로 액세스한 이후 다음 액세스까지 최고 활성화 상태를 유지할 수 있는 최대 기간을 의미한다. 예를 들어, AT가 7일이면 파일을 마지막으로 액세스한 후 7일이 경과할 때까지는 파일 활성화 비율이 최대값인 1로 유지된다. 마지막 액세스 이후 다음 액세스까지 경과 시간이 7일을 넘어가면 파일 활성화 비율은 1보다 작아지기 시작한다. 파일을 액세스하면 파일 활성화 비율은 다시 최대값인 1로 설정되고 이 값은 임계값인 7일동안 유지된다. 다음 액세스 없이 경과 시간이 임계값을 넘어가면 이후부터 활성화 비율은 경과 시간에 비례하여 감소한다. 디렉토리 내의 모든 파일들의 활성화 비율을 구한 후, 디렉토리 활성화 비율은 다음과 같이 평균값으로 정의한다.

(2)
$DAR=\dfrac{\sum_{i=0}^{N-1}FAR_{i}}{N},\:(0\le DAR\le 1)$

식(2)에서 N은 디렉토리 내의 모든 파일 개수이다. FARi는 i번째 (i는 0-based 인덱스) 파일의 활성화 비율이다. 디렉토리 내에 서브 디렉토리가 존재하여 i번째 파일 타입이 디렉토리이면 파일 활성화 비율 대신 해당 서브 디렉토리의 활성화 비율(DARi)을 이용한다. 디렉토리가 비어 있는 경우 이 디렉토리의 활성화 비율은 0으로 초기화한다.

능동 파일 모드 변경 메카니즘은 주기적으로 디렉토리 활성화 비율을 업데이트하여 파일 모드를 변경할 필요가 있는지 확인한다. 그림2는 능동 파일 모드 변경 메카니즘이 파일 모드 변경 여부를 판별하는 과정을 나타낸 순서도이다. 능동 파일 모드 변경 메카니즘은 먼저 디렉토리의 활성화 비율을 계산하고 이 값이 OMT보다 작은지 검사한다. OMT는 온라인 모드 임계값(Online Mode Threshold)을 의미하며 능동 파일 모드 변경 메카니즘이 디렉토리 활성화 관점에서 디렉토리 내의 파일들을 온라인 모드로 변경하는 작업을 시작할지 여부를 판단하는 기준이 된다. 디렉토리 활성화 비율이 온라인 모드 임계값보다 작으면, 능동 파일 모드 변경 메카니즘은 이 디렉토리의 비활성화 정도가 기준치를 넘었다고 판단하고 파일들 중에서 온라인 모드 변경 대상을 선별하고 모드를 변경하는 작업을 시작한다. 디렉토리 활성화 비율이 온라인 모드 임계값 이상이면 다음으로 LMT보다 큰지 검사한다. LMT는 로컬 모드 임계값(Local Mode Threshold)을 의미하며 능동 파일 모드 변경 메카니즘이 디렉토리 내의 파일들을 로컬 모드로 변경하는 작업을 시작할지 여부를 판단하는 기준이 된다. 디렉토리 활성화 비율이 로컬 모드 임계값보다 크면, 능동 파일 모드 변경 메카니즘은 이 디렉토리의 활성화 정도가 기준치를 넘었다고 판단하고 파일들 중에서 로컬 모드 변경 대상을 선별하고 모드를 변경하는 작업을 시작한다. 온라인 모드 임계값은 로컬 모드 임계값보다 작거나 같으며, 디렉토리 활성화 비율이 온라인 모드 임계값과 로컬 모드 임계값 사이이면 능동 파일 모드 변경 메카니즘은 현재 파일 모드를 유지한다.

그림. 2. 파일 모드 변경 여부 판별 알고리즘

Fig. 2. Algorithm for determining file mode change

../../Resources/kiee/KIEE.2023.72.2.241/fig2.png

그림3은 능동 파일 모드 변경 메카니즘이 디렉토리 내 파일들을 온라인 모드로 변경하는 과정을 나타낸 순서도이다. 디렉토리의 활성화가 낮다는 것은 파일들을 잘 액세스하지 않는다는 것이고 이러한 파일을 온라인 모드로 변경함으로써 가용 로컬 스토리지를 더 확보할 수 있다. 이를 위해 능동 파일 모드 변경 메카니즘은 먼저 스토리지 사용 비율(Storage Usage Ratio, SUR)을 계산한다. 스토리지 사용 비율은 동기화 디렉토리에 할당된 전체 스토리지 용량 대비 현재 사용중인 용량 비율이다. 스토리지 사용 비율이 임계값(Storage Usage Ratio Threshold, SURT)보다 작거나 같으면, 이는 현재 사용 가능한 로컬 스토리지 용량이 아직 충분하다는 의미이기 때문에 아직 파일을 온라인 모드로 변경할 필요 없고 이 작업은 중단된다. 스토리지 사용 비율이 임계값보다 크면, 현재 로컬 스토리지 용량이 정해진 기준 이상 사용되고 있기 때문에 가용 공간을 더 확보할 필요가 있다는 의미이다. 이 경우, 능동 파일 모드 변경 메카니즘은 온라인 모드로 변경할 파일을 선별하는 작업을 진행한다. 우선 변경 대상은 마지막 액세스 시간이 오래된 파일이므로, 현재 로컬 모드 파일 리스트를 마지막 액세스 시간 기준으로 오름차순으로 정렬하고 오래된 파일부터 순서대로 온라인 모드로 변경한다. 로컬 모드 파일이 온라인 모드로 변경될 때마다 파일 크기만큼 로컬 스토리지 사용 비율이 감소하고, 이 값이 임계값보다 작거나 같을 때까지 온라인 모드 변경 작업을 반복한다. 여기서 스토리지 사용 비율 임계값은 능동 파일 모드 변경 메카니즘이 스토리지 용량 관점에서 온라인 모드 변경 작업이 필요한지 판단하는 기준임과 동시에, 온라인 모드 변경을 통해 스토리지 사용 비율을 어느 수준까지 낮출 것인지 결정하는 기준이다. 예를 들어, 스토리지 사용 비율 임계값이 0.5이면, 능동 파일 모드 변경 메카니즘은 스토리지 사용 비율이 50\%가 넘으면 온라인 모드 변경을 시작하고 비율이 50\% 아래로 낮아지면 온라인 모드 변경 작업을 종료한다. 임계값이 0이면 능동 파일 모드 변경 메카니즘은 디렉토리 내의 모든 파일을 온라인 모드로 변경하고, 임계값이 1이면 스토리지 사용 비율과 상관없이 어떤 파일에 대해서도 온라인 모드 변경 작업을 수행하지 않게 된다.

그림. 3. 온라인 모드 변경 알고리즘

Fig. 3. Online mode change algorithm

../../Resources/kiee/KIEE.2023.72.2.241/fig3.png

디렉토리 활성화 비율이 로컬 모드 임계값보다 커지면 능동 파일 모드 변경 메카니즘은 디렉토리 내 온라인 모드 파일들을 로컬 모드로 변경하는 태스크를 시작한다. 그림4는 로컬 모드 변경 과정을 나타낸 순서도이다. 온라인 모드 변경 과정과 마찬가지로, 로컬 모드 변경 과정에서도 먼저 로컬 스토리지의 현재 사용 비율(SUR)을 계산하여 스토리지 사용 비율 임계값(SURT)과 비교한다. 스토리지 사용 비율이 임계값보다 크면, 능동 파일 모드 변경 메카니즘은 로컬 스토리지가 이미 기준치 이상으로 사용되고 있는 것으로 판단하고 로컬 모드 변경 작업을 중단한다. 로컬 스토리지 용량이 충분한 경우, 다음 작업은 로컬 모드 변경 대상 온라인 모드 파일을 선별하는 것이다. 클라이언트 입장에서 크기가 큰 온라인 모드 파일을 액세스하려는 경우, 먼저 서버로부터 이 파일을 다시 다운로드하는 지연 시간이 필요하기 때문에 액세스 시간이 길어진다. 사용자마다 자신이 허용할 수 있는 액세스 시간 최대값이 있으면, 이 허용 시간보다 더 길어질 정도로 크기가 큰 온라인 모드 파일을 우선적으로 로컬 모드로 변경하면 평균 액세스 시간을 클라이언트의 허용 범위 안에 유지할 수 있다. 이를 위해, 클라이언트는 제안 메카니즘에 최대 허용 액세스 지연 임계값(Maximum Access Delay Threshold, MADT)을 설정할 수 있다. MADT 값으로 로컬 모드로 변경할 파일의 최소 크기를 계산하기 위해 먼저 클라이언트는 서버로부터의 입력 스루풋을 측정한다. 입력 스루풋은 현재 클라이언트가 서버로부터 데이터를 전송받는 속도를 초당 메가바이트 (MBps) 단위로 측정한 것이다. 입력 스루풋과 MADT를 곱하면, 최대 허용 액세스 시간이 필요한 파일의 최소 크기를 구할 수 있다. 온라인 모드 파일들 중에서 원본 크기가 최소 크기보다 작은 파일은 로컬 모드 변경 대상에서 제외된다. 이 파일들은 클라이언트가 액세스할 때 허용 최대 액세스 시간 내에 서버로부터 다운로드 가능한 파일들이기 때문이다. MADT 값이 0보다 작거나 같으면, 로컬 모드로 변경할 파일의 최소 크기 기준은 무시되고 모든 온라인 모드 파일이 변경 대상이 된다. 최소 기준 크기 이상의 온라인 모드 파일들은 다시 마지막 액세스 시간 기준으로 내림차순으로 정렬하여 가장 최근에 액세스한 파일을 우선 변경 대상으로 한다. 로컬 모드 변경 대상으로 선별된 온라인 모드 파일들은 모두 로컬 모드로 변경하지 않고, 스토리지 사용 비율(SUR)이 임계값(SURT)보다 커질 때까지만 변경하여 로컬 스토리지의 가용 공간도 고려하여 진행한다. 만약 모든 모드 변경 대상 파일들을 로컬 모드로 변경해도 스토리지 사용 비율이 임계값보다 작아서 로컬 스토리지 여유가 충분하면, 최소 기준 크기보다 작은 온라인 모드 파일들도 로컬 모드로 변경할 수 있다.

그림. 4. 로컬 모드 변경 알고리즘

Fig. 4. Local mode change algorithm

../../Resources/kiee/KIEE.2023.72.2.241/fig4.png

5. 파일 모드에 따른 동기화 성능 모델

클라우드 스토리지 서비스의 클라이언트에서 능동 파일 모드 변경 메카니즘은 디렉토리 활성화 비율과 다른 관련 파라미터들을 기반으로 파일들을 능동적으로 선택하여 로컬 모드 또는 온라인 모드로 변경한다. 여기서 능동 파일 모드 변경 메카니즘이 파일들을 로컬 모드나 온라인 모드 중 한 가지로 일괄적으로 변경하지 않는 이유는, 성능 측면에서 두 파일 모드의 장단점이 서로 상충하기 때문이다. 로컬 모드 파일은 클라이언트의 로컬 스토리지 공간을 차지하는 대신에 바로 액세스할 수 있다. 반면에, 온라인 모드 파일은 로컬 스토리지 공간을 사용하지 않아서 절약할 수 있지만, 사용자가 액세스할 때 원본 파일을 서버로부터 다운로드하는 지연 시간이 증가한다. 즉, 서로 다른 파일 모드를 통해 알 수 있는 것은 로컬 스토리지 사용율과 파일 액세스 지연 시간이라는 두 가지 지표가 서로 트레이드 오프 관계라는 것이다. 만약 클라이언트가 파일 액세스 지연 시간과 상관없이 로컬 스토리지 사용율만을 최소화하기를 원한다면, 모든 파일들을 온라인 모드로 변경하면 된다. 반대로, 만약 클라이언트가 파일 액세스 지연 시간만을 최소화하기를 원하면, 모든 파일들을 로컬 모드로 변경하면 된다. 만약 클라이언트가 로컬 스토리지 사용율과 파일 액세스 지연 시간을 모두 고려하여 파일 모드를 결정하려고 한다면, 온라인 모드와 로컬 모드를 절충하여 파일 모드를 변경해야 한다. 이를 위해, 우리는 먼저 로컬 스토리지 사용율과 파일 액세스 지연 시간 각각의 중요도에 따라 파일 모드 변경 메카니즘의 성능을 파일 모드 성능 지수로 정량화한다. 파일 모드 변경 메카니즘이 작동중인 상태에서 일정 시간 동안 동기화 디렉토리 내의 파일들을 액세스한 후, 파일 모드 성능 지수(FMPI)는 다음과 같이 정의한다.

(3)
$FM\Pi =w_{sur}\times SUR+w_{fadr}\times FADR$

식(3)에서 SUR은 로컬 스토리지 사용율(Storage Usage Ratio)을 의미하고 FADR은 파일 액세스 딜레이 비율(File Access Delay Ratio)을 의미한다. 파일 모드 성능 지수 (FMPI), 로컬 스토리지 사용율 (SUR), 파일 액세스 지연 시간 비율(FADR)은 모두 0과 1사이의 비율값이며 값이 작을수록 좋은 성능을 나타낸다. 각 비율값은 상대적 중요도를 의미하는 가중치를 가지는데, wsur은 로컬 스토리지 사용율의 가중치이고 wfadr은 파일 액세스 지연 시간 비율의 가중치이다. 가중치도 0과 1사이의 비율로 나타낸다. 로컬 스토리지 사용율과 파일 액세스 지연 시간 비율은 트레이드 오프 관계가 있기 때문에, 가중치를 단순화하여 파일 모드 성능 지수(FMPI)는 다음과 같이 표현한다.

(4)
$FM\Pi =w\times SUR+(1-w)\times FADR$

식(4)에서 w는 로컬 스토리지 사용율의 가중치(wsur)이고, 두 가중치의 합은 1이다. 클라이언트가 파일 모드 변경 성능에서 로컬 스토리지 사용율을 중요하게 고려할수록 가중치 w를 높게 설정한다. 그럼 반대로 파일 액세스 지연 시간 비율의 중요도는 상대적으로 낮아진 1-w의 값이 된다. 클라이언트가 로컬 스토리지 사용율만을 중요 지표로 사용한다면 이 가중치 w는 1로 설정하여 로컬 스토리지 사용율 값을 모두 파일 모드 성능 지수(FMPI)에 반영한다. 이 때, 파일 액세스 지연 시간 비율의 가중치는 반대로 0이 되어 파일 모드 성능 지수에 반영되지 않는다. 만약, 두 지표의 가중치를 동일하게 0.5로 설정하면 로컬 스토리지 사용율과 파일 액세스 지연 시간 비율 값을 동일한 비중으로 파일 모드 성능 지수에 반영할 수 있다. 각 지표의 가중치에 따른 파일 모드 성능 지수는 다음 장의 성능 실험에서 구체적으로 결과를 분석할 예정이다.

로컬 스토리지 사용율(SUR)은 능동 파일 모드 변경 메카니즘에서 정의한 사용 스토리지 비율(Storage Usage Ratio)과 동일한 의미이다. 즉, 동기화에 할당된 총 로컬 스토리지 용량 중 현재 클라이언트가 사용중인 공간 비율로 계산한다. 파일 액세스 지연 시간 비율(FADR)은, 현재까지 사용자가 파일을 액세스한 총 횟수 중에서 사용자가 허용하는 최대 지연 시간을 초과하여 액세스한 횟수의 비율로 계산한다. 이는 로컬 모드 파일을 액세스하는 경우를 제외하고 온라인 모드 파일을 액세스할 때 서버로부터 원본 파일을 다운로드하는 시간이 허용 기준 시간을 초과하는 경우를 의미한다. 사용자가 허용하는 최대 지연 시간은 능동 파일 모드 변경 메카니즘에서 정의한 최대 허용 액세스 지연 임계값(MADT)과 동일하다. 최대 허용 액세스 지연 임계값을 설정하지 않은 경우에 파일 액세스 지연 시간 비율(FADR)은 총 파일 액세스 횟수 중에서 온라인 모드 파일을 액세스한 횟수 비율로 대신 계산한다.

다음 장에서는 파일 모드 성능 지수(FMPI)를 기준으로 로컬 스토리지 사용율 및 파일 액세스 지연 시간 비율의 가중치에 따라 본 논문에서 제안한 능동 파일 모드 변경 메카니즘과 기존의 수동 파일 모드 변경 메카니즘의 성능을 비교한다. 또한, 능동 파일 모드 변경 메카니즘의 파일 모드 변경 작업에 영향을 주는 파라미터와 파일 모드 성능 지수의 상관관계도 함께 분석한다.

6. 성능 분석

이번 장에서는 본 논문에서 제안한 능동 파일 모드 변경 메카니즘과 기존의 수동 파일 모드 변경 메카니즘의 성능을 비교 분석하기 위해 수행한 실험에 대해 기술한다. 제안하는 능동 파일 모드 변경 메카니즘은 동기화 디렉토리의 활성화 정도, 동기화 로컬 스토리지의 사용 비율, 파일 액세스 시간 등의 요소에 따라 파일의 로컬 모드와 온라인 모드를 동적으로 변경하기 때문에 다음의 두 가지 시나리오로 실험을 진행했다. 첫 번째 디렉토리 비활성화 시나리오에서는 클라이언트가 동기화 디렉토리 내의 파일들을 주기적으로 액세스하여 디렉토리를 활성화 상태로 유지하다가 특정 시점 이후에 파일 액세스를 중단하여 디렉토리를 비활성화 상태로 변경한다. 두 번째 디렉토리 활성화 시나리오에서는 반대로 클라이언트가 일정 기간동안 어느 파일도 액세스하지 않고 디렉토리를 비활성화 상태로 유지하다가 특정 시점 이후에 파일 액세스를 시작하여 디렉토리의 활성화 레벨을 증가시킨다. 이러한 두 가지 파일 액세스 시나리오로 실험을 수행했을 때 능동 파일 모드 변경 메카니즘과 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수(FMPI)를 측정하여 두 방법의 차이를 비교 분석했다.

6.1 실험환경

위에서 언급한 두 가지 파일 액세스 시나리오에 공통으로 적용한 구체적인 실험 환경은 다음과 같다. 액세스 실험은 1MB의 랜덤 바이트로 생성한 동일한 크기의 테스트 파일 10개를 대상으로 한다. 실제 1초는 실험 환경에서 1시간으로 가정하고 전체 파일 액세스 실험 기간은 6일이다. 즉, 파일 액세스 시나리오 1회 실험을 수행하는 실제 시간은 144초(= 24*6)이다. 실험 기간 6일 중 처음 3일과 후반 3일의 두 기간 동안 수행되는 파일 액세스 동작은 시나리오에 따라 다르게 진행되며 이는 각 시나리오 실험 환경에서 자세히 기술한다. 두 가지 실험 시나리오 모두에서 능동 파일 모드 변경 메카니즘이 사용하는 파라미터의 기본값은 표2와 같다.

표 2. 능동 파일 모드 변경 메카니즘의 파라미터 기본값

Table 2. Default parameter values of active file mode change mechanism

파라미터명

기본값

MONITORING_PERIOD (MP)

11시간

TOTAL_STORAGE (TS)

10MB

AGING_THRESHOLD (AT)

36시간

ONLINE_MODE_THRESHOLD (OMT)

0.5

LOCAL_MODE_THRESHOLD (LMT)

0.5

STORAGE_USAGE_RATIO_THRESHOLD (SURT)

0.5

MAX_ACCESS_DELAY_THRESHOLD (MADT)

0

MONITORING_PERIOD(MP)는 능동 파일 모드 변경 메카니즘이 디렉토리의 활성화 비율을 계산하는 주기이다. 파일 액세스 실험이 시작된 후 11시간째마다 능동 파일 모드 변경 메카니즘은 현재 디렉토리의 활성화를 계산하고 이 값을 바탕으로 파일 모드 변경 여부를 판단한다. TOTAL_STORAGE(TS)는 파일 동기화를 위해 할당된 로컬 스토리지 총량을 나타내며 실험에서 스토리지 사용 비율을 계산할 때 필요하다. 이 값은 클라이언트의 로컬 스토리지 전체 용량일수도 있고 이보다 작은 임의의 값으로 설정할 수도 있다. 이 실험에서는 10MB를 기본값으로 설정했다. AGING_THRESHOLD (AT)는 파일의 마지막 액세스 이후 경과 시간 임계값으로, 파일을 마지막으로 액세스한 이후 이 파일의 활성화 비율이 최대값 1을 유지하는 시간을 나타낸다. 이 실험에서는 기본값을 36시간으로 설정했으며, 이는 파일을 액세스한 이후 하루 반(36시간)동안은 이 파일의 활성화 비율이 1을 유지함을 의미한다. 이 임계값 시간 이후에도 파일 액세스가 없으면 이 파일의 활성화 비율은 이 임계값 이후 경과 시간에 비례하여 감소한다. ONLINE_MODE_THRESHOLD (OMT)는 온라인 모드 임계값으로써 능동 파일 모드 변경 메카니즘이 파일들을 온라인 모드로 변경 작업을 시작할지 여부를 판단하는 기준이 된다. 측정한 디렉토리 활성화 비율이 온라인 모드 임계값보다 작으면 능동 파일 모드 변경 메카니즘은 디렉토리 내 파일들을 선별하여 온라인 모드로 변경하는 작업을 수행한다. 이 실험에서 온라인 모드 임계값은 0.5로 설정했다. LOCAL_MODE_THRESHOLD (LMT)는 로컬 모드 임계값이다. 이 임계값은 능동 파일 모드 변경 메카니즘이 파일을 로컬 모드로 변경할지 여부를 결정하는 기준이 된다. 디렉토리 활성화 비율이 로컬 모드 임계값보다 크면, 능동 파일 모드 변경 메카니즘은 디렉토리 내 온라인 모드 파일들 중 선별하여 로컬 모드로 변경하는 작업을 시작한다. 온라인 모드 임계값과 마찬가지로 이 실험에서 로컬 모드 임계값은 0.5로 설정했다. STORAGE_ USAGE_RATIO_THRESHOLD (SURT)는 로컬 스토리지 사용 비율 임계값이며, 능동 파일 모드 변경 메카니즘이 파일 모드를 온라인 혹은 로컬 모드로 변경할 때 로컬 스토리지 사용 비율이 이 임계값을 넘지 않도록 조절하는 역할을 수행한다. 이 실험에서 로컬 스토리지 사용 비율 임계값의 기본값은 0.5로 설정했다. 예를 들어, 능동 파일 모드 변경 메카니즘이 파일들을 온라인 모드로 변경할 때는 로컬 스토리지 사용량이 총량 10MB의 50\%인 5MB보다 작거나 같아질 때까지만 변경 작업을 수행하고, 로컬 모드로 변경할 때는 로컬 스토리지 사용량이 반대로 5MB보다 커질 때까지만 변경하도록 제한한다. MAX_ACCESS_DELAY_THRESHOLD (MADT)는 최대 허용 액세스 지연 임계값으로써 능동 파일 모드 변경 메카니즘이 로컬 모드로 변경할 온라인 모드 파일의 최소 크기를 결정하는데 사용한다. 이 실험에서는 최대 허용 액세스 지연 임계값을 0으로 설정했고, 이는 로컬 모드로 변경 대상 파일을 선택할 때 최소 크기는 고려하지 않고 마지막 액세스 시간만 고려한다는 것을 의미한다.

실험을 진행하기 위해, 파일 동기화 프레임워크의 파일 동기화 서비스 중 파일 모드 변경 기능은 기존의 수동 파일 모드 변경 방식뿐만 아니라 제안하는 능동 파일 모드 변경 메카니즘을 서비스로 구현했고, 이 프레임워크를 이용하는 동기화 서버 및 클라이언트 프로토타입을 개발했다. 실험에 사용한 동기화 서버 및 클라이언트는 무선랜(WIFI)으로 연결했고 각 디바이스의 사양은 표3에 기술했다.

표 3. 디바이스 사양

Table 3. Device specifications

서버

클라이언트

운영체제

macOS Monterey

Windows 11 Pro

CPU

2.4GHz, Intel Core i5

2.3GHz, Intel Core i7

메모리

16GB

16GB

저장장치

SSD 512MB

SSD 1TB

6.2 디렉토리 비활성화 실험

첫 번째 시나리오인 디렉토리 비활성화 실험에서 전체 실험 기간 (6일) 중 처음 3일 동안은 주기적인 파일 액세스 작업을 수행하고, 후반 3일 동안은 어떤 파일 액세스도 수행하지 않는다. 즉, 처음 3일은 디렉토리 활성화 기간이고 후반 3일은 디렉토리 비활성화 기간이라고 할 수 있다. 동기화 디렉토리가 비어있는 상태에서 실험을 시작하여, 처음 디렉토리 활성화 기간 동안의 파일 액세스 작업은 신규 파일 추가와 기존 파일을 업데이트하는 두 가지 동작을 반복한다. 신규 파일 추가 주기는 5시간이고 기존 파일 업데이트 주기는 2시간이다. 신규 파일 추가를 위해 테스트 파일 10개를 임시 디렉토리에 미리 생성해 놓고, 추가 주기마다 파일을 하나씩 차례대로 동기화 디렉토리로 복사한다. 기존 파일의 업데이트는 동기화 디렉토리에 신규 추가된 파일부터 순서대로 한 파일씩 업데이트 주기마다 진행한다. 파일의 업데이트 방식은 파일 모드에 따라 다르게 진행된다. 로컬 모드 파일의 업데이트는 임시 디렉토리 내의 동일한 테스트 파일을 다시 동기화 디렉토리 내 파일로 복사하여 덮어쓴다. 온라인 모드 파일인 경우에는 해당 파일을 로컬 모드로 변경한다.

이 실험을 통해 동기화 디렉토리가 활성화 단계에서 비활성화 단계로 바뀌는 동안 로컬 스토리지 사용 비율과 파일 액세스 비용을 측정하고 이를 기반으로 파일 모드 성능 지수(FMPI)를 계산했다. 이를 위해, 실험 기간 동안 파일 액세스 (신규 추가 또는 업데이트) 작업이 진행될 때마다 현재 로컬 스토리지 사용량과 액세스 대상 파일의 파일 모드를 기록하여 통계를 내는 방식을 사용했다. 액세스한 파일의 모드를 기록한 것은 파일 액세스 비용을 구하기 위해서인데, 로컬 파일을 액세스하는 경우에는 비용이 없는 반면 온라인 모드를 액세스하는 경우에는 이를 로컬 모드로 변경하기 위해 서버로부터 파일 전체를 다운로드하는 비용이 발생한다. 본 실험에서 파일의 크기는 모두 동일하기 때문에, 파일 액세스 비용은 실제 다운로드 시간이 아닌 온라인 모드 파일을 액세스한 횟수로 측정했다. 수동 파일 모드 변경 메카니즘과 능동 파일 모드 변경 메카니즘을 대상으로 위에서 언급한 동일한 조건에서 디렉토리 비활성화 실험을 수행했다. 능동 파일 모드 변경 메카니즘의 경우에는 파라미터의 변화가 파일 모드 성능 지수에 미치는 영향을 관찰하기 위해 마지막 액세스 이후 경과 시간 임계값(AT), 온라인 모드 임계값 (OMT), 스토리지 사용 비율 임계값 (SURT)의 세 가지 임계값을 변화하며 실험을 진행했다. 로컬 모드 임계값(LMT)은 온라인 모드 임계값(OMT)보다 크거나 같아야 하는데 본 실험에서는 OMT와 같은 값으로 설정했다. 파일 모드 성능 지수는 로컬 스토리지 사용 비율 및 파일 액세스 지연 비율의 가중치를 동일 가중치인 (0.5, 0.5), 스토리지 사용 비율만 고려한 가중치인 (1.0, 0), 파일 액세스 지연 비율만 고려한 가중치인 (0, 1.0)의 세 가지로 분류하여 계산했다. 디렉토리 비활성화 시나리오의 전체 실험 기간동안 클라이언트가 대부분 로컬 모드 파일만을 액세스했기 때문에 파일 액세스 지연 비율만 고려한 가중치 (0, 1.0)에서의 파일 모드 성능 지수는 제외했다.

그림5그림6은 능동 파일 모드 변경 메카니즘의 마지막 액세스 이후 경과 시간 임계값(AT)에 따른 파일 모드 성능 지수와 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수 결과를 나타낸다. 그림5는 스토리지 사용 비율과 파일 액세스 지연 비율에 동일한 가중치인 0.5를 적용했을 때의 파일 모드 성능 지수 그래프이다. 임계값의 변화에 상관없이 능동 파일 모드 변경 메카니즘의 파일 모드 성능 지수가 수동 파일 모드 변경 메카니즘보다 항상 작다. 이는 스토리지 사용 비율의 차이 때문인데, 능동 파일 모드 변경 메카니즘은 액세스한지 오래되어 비활성화된 파일들을 온라인 모드로 변경하여 스토리지 사용 비율을 낮춘 반면에, 수동 파일 모드 변경 메카니즘은 파일들이 액세스 여부와 상관없이 로컬 모드를 유지하기 때문이다. 능동 파일 모드 변경 메카니즘의 마지막 액세스 이후 경과 시간 임계값(AT)이 변화에 따른 파일 모드 성능 지수를 살펴보면, AT값이 커질수록 파일 모드 성능 지수값이 커지는 것을 볼 수 있다. 능동 파일 모드 변경 메카니즘은 AT값이 클수록, 액세스하지 않은 파일을 더 오래동안 활성화 상태인 것으로 판단하기 때문에 파일을 온라인 모드로 변경하는 시점이 늦어진다. 그러면, 로컬 스토리지 사용율의 감소 정도가 작아지기 때문에 파일 모드 성능 지수는 높아진다. 따라서, 마지막 액세스 이후 경과 시간 임계값이 작을수록 능동 파일 모드 변경 메카니즘의 성능이 나아진다. 그림6은 파일 액세스 지연 비율을 무시하고 로컬 스토리지 사용율만 고려했을 때의 파일 모드 성능 지수 그래프이다. 디렉토리 비활성화 실험에서는 온라인 모드 파일을 액세스하는 경우가 없었기 때문에, 파일 액세스 지연 비율에 의한 파일 모드 성능 지수의 영향은 없었다. 따라서, 로컬 스토리지만 고려했을 때와 동일 가중치를 적용했을 때의 파일 모드 성능 지수는 절대값만 다를 뿐 상대적인 차이는 동일했다.

그림. 5. 디렉토리 비활성화 실험에서 마지막 액세스 이후 경과 시간 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 0.5, 파일 액세스 지연 가중치 = 0.5)

Fig. 5. FMPI according to AT in directory deactivation experiment (storage weight = 0.5, file access delay weight = 0.5)

../../Resources/kiee/KIEE.2023.72.2.241/fig5.png

그림. 6. 디렉토리 비활성화 실험에서 마지막 액세스 이후 경과 시간 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 1.0, 파일 액세스 지연 가중치 = 0)

Fig. 6. FMPI according to AT in directory deactivation experiment (storage weight = 1.0, file access delay weight = 0)

../../Resources/kiee/KIEE.2023.72.2.241/fig6.png

그림7그림8은 능동 파일 모드 변경 메카니즘의 온라인 모드 임계값(OMT)에 따른 파일 모드 성능 지수와 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수 결과를 나타낸다. 이전 파일 모드 성능 지수와 마찬가지로 파일 액세스 지연에 의한 파일 모드 성능 지수는 영향이 없기 때문에 로컬 스토리지 사용율 가중치가 0.5인 경우(그림7)와 1인 경우 (그림8) 모두 상대적 결과는 동일하다. 그림7그림8에서 온라인 모드 임계값(OMT)이 0에서 0.3일 때까지는 능동 파일 모드 변경 메카니즘의 파일 모드 성능 지수가 수동 파일 모드 변경 메카니즘과 동일하다. 그러나, OMT 값이 0.3보다 커지는 시점부터 능동 파일 모드 변경 메카니즘의 파일 모드 성능 지수가 작아지는 것을 알 수 있다. 온라인 모드 임계값(OMT)은 마지막 액세스 이후 경과 시간 임계값과 마찬가지로 파일을 온라인 모드로 변경하는 시점에 영향을 주는 파라미터이다. 능동 파일 모드 변경 메카니즘은 디렉토리 활성화 비율이 OMT값보다 작은 경우에 액세스 시간이 오래된 파일들 중 온라인 모드로 변경하는 작업을 시작한다. 따라서, OMT값이 클수록 비활성화 상태의 디렉토리 활성화 비율이 OMT보다 작아지는 시점이 빨라지기 때문에, 온라인 모드로 변경되는 파일이 많아지면서 로컬 스토리지 사용율이 더욱 감소할 수 있다. 반대로, OMT값이 0.3까지 작은 경우에는 디렉토리 활성화 비율이 이보다 낮아지지 않아서 온라인 모드 변경되는 파일이 없었고 수동 파일 모드 변경 메카니즘과 같은 파일 모드 성능 지수를 나타낸 것이다. AT와 OMT 임계값은 모두 스토리지 사용율의 감소 시점에 영향을 주는 역할면에서 비슷하다. 이 두 임계값의 역할을 구분하면, AT는 디렉토리 활성화 비율 계산에 영향을 주는 요소이고 OMT는 온라인 모드 변경 작업 시작 여부를 판단하는 기준이다.

그림. 7. 디렉토리 비활성화 실험에서 온라인 모드 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 0.5, 파일 액세스 지연 가중치 = 0.5)

Fig. 7. FMPI according to OMT in directory deactivation experiment (storage weight = 0.5, file access delay weight = 0.5)

../../Resources/kiee/KIEE.2023.72.2.241/fig7.png

그림. 8. 디렉토리 비활성화 실험에서 온라인 모드 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 1.0, 파일 액세스 지연 가중치 = 0)

Fig. 8. FMPI according to OMT in directory deactivation experiment (storage weight = 1.0, file access delay weight = 0)

../../Resources/kiee/KIEE.2023.72.2.241/fig8.png

그림9그림10은 능동 파일 모드 변경 메카니즘의 로컬 스토리지 사용 비율 임계값(SURT)에 따른 파일 모드 성능 지수와 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수 결과를 나타낸다. AT 임계값의 경우와 마찬가지로, SURT 임계값과 상관없이 능동 파일 모드 변경 메카니즘의 파일 모드 성능 지수가 수동 파일 모드 변경 메카니즘보다 좋다는 것을 알 수 있다. 능동 파일 모드 변경 메카니즘이 파일들이 온라인 모드로 변경하여 스토리지 사용율을 향상시켰기 때문이다. SURT는 능동 파일 모드 변경 메카니즘이 비활성화된 디렉토리의 파일들을 온라인 모드로 변경할 때 스토리지 사용율이 SURT 값 이하가 될 때까지만 변경하도록 제한하는 하한선을 의미한다. 따라서 SURT 값이 작을수록 로컬 스토리지 사용율이 더 낮아질 때까지 많은 파일들을 온라인 모드로 변경할 수 있기 때문에, 파일 모드 성능 지수가 낮아진다.

그림. 9. 디렉토리 비활성화 실험에서 로컬 스토리지 사용 비율 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 0.5, 파일 액세스 지연 가중치 = 0.5)

Fig. 9. FMPI according to SURT in directory deactivation experiment (storage weight = 0.5, file access delay weight = 0.5)

../../Resources/kiee/KIEE.2023.72.2.241/fig9.png

그림. 10. 디렉토리 비활성화 실험에서 로컬 스토리지 사용 비율 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 1.0, 파일 액세스 지연 가중치 = 0)

Fig. 10. FMPI according to SURT in directory deactivation experiment (storage weigth = 1.0, file access delay weight = 0)

../../Resources/kiee/KIEE.2023.72.2.241/fig10.png

6.3 디렉토리 활성화 실험

두 번째 시나리오는 첫번째 시나리오와 반대로 디렉토리 활성화 실험이다. 전체 실험 기간 (6일) 중 처음 3일 동안은 어떤 파일 액세스도 수행하지 않고 디렉토리 비활성화 상태를 유지하다가, 후반 3일 동안 주기적인 파일 액세스를 수행하여 디렉토리를 활성화 시킨다. 동기화 디렉토리에는 10개의 테스트 파일이 모두 온라인 모드인 상태로 실험을 시작한다. 초반의 디렉토리 비활성화 기간에는 파일 액세스 주기마다 단지 현재의 로컬 스토리지 사용량만 기록한다. 후반의 디렉토리 활성화 기간에는 7시간 주기로 파일 하나씩 순서대로 액세스 작업을 진행한다. 파일 액세스 방식은 첫 번째 실험과 마찬가지로 파일 모드에 따라 다르다. 로컬 모드 파일은 임시 디렉토리 내의 동일한 테스트 파일을 다시 동기화 디렉토리로 복사하여 덮어쓰고, 온라인 모드 파일은 먼저 로컬 모드로 변경 작업을 진행한다.

이 실험에서는 동기화 디렉토리가 비활성화 단계에서 활성화 단계로 바뀌는 동안 로컬 스토리지 사용량과 파일 액세스 비용을 측정하고 이를 기반으로 파일 모드 성능 지수(FMPI)를 계산했다. 디렉토리 활성화 실험에서와 마찬가지로 파일 모드 성능 지수는 로컬 스토리지 사용 비율 및 파일 액세스 지연 비율의 가중치를 동일 가중치인 (0.5, 0.5), 스토리지 사용 비율만 고려한 가중치인 (1.0, 0), 파일 액세스 지연 비율만 고려한 가중치인 (0, 1.0)의 세 가지로 분류하여 계산했다. 능동 파일 모드 변경 메카니즘은 파라미터의 변화가 파일 모드 성능 지수에 미치는 영향을 분석하기 위해 마지막 액세스 이후 경과 시간 임계값(AT), 로컬 모드 임계값 (LMT), 스토리지 사용 비율 임계값 (SURT)의 세 가지 임계값을 변화하며 실험을 진행했다. 온라인 모드 임계값(OMT)은 LMT보다 작거나 같아야 하는데 본 실험에서는 앞의 실험과 마찬가지로 OMT와 같은 값으로 설정했다.

그림11 ~ 그림13은 능동 파일 모드 변경 메카니즘의 마지막 액세스 이후 경과 시간 임계값(AT)에 따른 파일 모드 성능 지수와 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수 결과를 나타낸다. 먼저 그림12에서 나타난 바와 같이, 수동 파일 모드 변경 메카니즘은 로컬 스토리지 사용율 관점에서만 볼 때 능동 파일 모드 변경 메카니즘보다 나은 성능을 보인다. 그 이유는 디렉토리 활성화 실험의 전반부인 비활성화 기간동안에 수동 파일 모드 변경 메카니즘은 모든 파일들이 온라인 모드인 채로 유지되었기 때문이다. 반면에 능동 파일 모드 변경 메카니즘은 이 실험의 비활성화 기간동안에도 디렉토리를 활성화 상태로 인식하여 파일들을 로컬 모드로 변경하여 스토리지 사용율을 높였다. AT 임계값이 커지면, 디렉토리가 활성화 상태를 유지하는 기간이 길어지기 때문에 파일들이 로컬 모드를 오래 유지하게 된다. 따라서, 로컬 스토리지 사용율 입장에서 파일 모드 성능 지수는 높아지는 경향을 보인다. 반대로 그림13에서와 같이, 파일 액세스 지연 시간만을 고려했을 때는 능동 파일 모드 변경 메카니즘이 수동 파일 모드 변경 메카니즘보다 나은 성능을 보인다. 수동 파일 모드 변경 메카니즘에서는 처음 액세스하는 모든 파일이 온라인 모드이기 때문에 로컬 모드로 변경하는 액세스 딜레이가 발생한다. 반면에 능동 파일 모드 변경 메카니즘에서는 미리 로컬 모드로 변경된 파일들이 존재하기 때문에 온라인 모드 파일을 액세스하는 비율이 낮아지는 효과가 나타난다. AT 임계값이 커지면, 파일들이 로컬 모드를 유지하는 기간도 길어지고 온라인 모드 파일을 액세스하는 경우가 적어지기 때문에 파일 액세스 지연 시간 관점에서의 파일 모드 성능 지수도 작아진다. 그림11은 로컬 스토리지 사용율 가중치와 파일 액세스 지연 비율 가중치를 동일하게 적용했을 때의 파일 모드 성능 지수 그래프이다. 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수는 0.579이고 능동 파일 모드 변경 메카니즘의 파일 모드 성능 지수 최소값은 AT가 36시간 일 때의 0.581로 거의 동일하다. 능동 파일 모드 변경 메카니즘에서는 AT 값이 클 때 파일 모드 성능 지수가 낮아지는 경향을 보였다.

그림. 11. 디렉토리 활성화 실험에서 마지막 액세스 이후 경과 시간 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 0.5, 파일 액세스 지연 가중치 = 0.5)

Fig. 11. FMPI according to AT in directory activation experiment (storage weight = 0.5, file access delay weight = 0.5)

../../Resources/kiee/KIEE.2023.72.2.241/fig11.png

그림. 12. 디렉토리 활성화 실험에서 마지막 액세스 이후 경과 시간 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 1.0, 파일 액세스 지연 가중치 = 0)

Fig. 12. FMPI according to AT in directory activation experiment (storage weight = 1.0, file access delay weight = 0)

../../Resources/kiee/KIEE.2023.72.2.241/fig12.png

그림. 13. 디렉토리 활성화 실험에서 마지막 액세스 이후 경과 시간 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 0, 파일 액세스 지연 가중치 = 1.0)

Fig. 13. FMPI according to AT in directory activation experiment (storage weight = 0, file access delay weight = 1.0)

../../Resources/kiee/KIEE.2023.72.2.241/fig13.png

그림14 ~ 그림16은 능동 파일 모드 변경 메카니즘의 로컬 모드 임계값(LMT)에 따른 파일 모드 성능 지수와 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수 결과를 나타낸다. 디렉토리 비활성화 실험에서 온라인 모드 임계값(OMT)이 파일을 온라인 모드로 변경하는 시점에 영향을 주는 파라미터인 것과 마찬가지로 디렉토리 활성화 실험에서 로컬 모드 임계값(LMT)도 파일을 로컬 모드로 변경하는 시점에 영향을 주는 파라미터이다. 능동 파일 모드 변경 메카니즘은 디렉토리 활성화 비율이 LMT보다 커지면 파일들을 선별하여 로컬 모드로 변경하는 작업을 수행한다. 따라서, LMT가 작을수록 능동 파일 모드 변경 메카니즘은 파일들은 빠르게 로컬 모드로 변경시킨다. 그림14는 로컬 스토리지 사용율과 파일 액세스 지연 비율 가중치가 동일할 때의 파일 모드 성능 지수 그래프이다. 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수는 0.58이고 능동 파일 모드 변경 메카니즘의 파일 모드 성능 지수 최소값은 LMT가 0에서 0.4까지 동일하게 0.56이다. LMT 값이 클수록 능동 파일 모드 변경 메카니즘은 로컬 모드 변경이 지연됨으로써 얻는 로컬 스토리지 사용율의 이점보다 온라인 모드 파일을 액세스함으로써 증가하는 지연 시간이 파일 모드 성능 지수에 더 영향을 주는 것으로 나타났다. 즉, 동일한 가중치일 때, 능동 파일 모드 변경 메카니즘의 파일 모드 성능 지수는 LMT 값이 작을수록 좋다. 그림15는 스토리지 사용율 가중치만 적용했을 때의 파일 모드 성능 지수 그래프이다. 디렉토리의 비활성화 기간동안 모든 파일들이 온라인 모드로 유지되는 수동 파일 모드 변경 메카니즘이 능동 파일 모드 변경 메카니즘보다 파일 모드 성능 지수값이 낮은 것은 당연하다. 하지만 그림16처럼 파일 액세스 지연 비율 가중치만 적용했을 때는 반대로 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수가 매우 높게 나타난다. 모든 파일들이 온라인 모드로 유지되기 때문에 파일을 액세스할 때마다 로컬 모드로 변경하는 액세스 지연이 발생하기 때문이다. 그림15에서 능동 파일 모드 변경 메카니즘은 LMT 값이 클수록 낮은 파일 모드 성능 지수를 보인다.

그림. 14. 디렉토리 활성화 실험에서 로컬 모드 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 0.5, 파일 액세스 지연 가중치 = 0.5)

Fig. 14. FMPI according to LMT in directory activation experiment (storage weight = 0.5, file access delay weight = 0.5)

../../Resources/kiee/KIEE.2023.72.2.241/fig14.png

그림. 15. 디렉토리 활성화 실험에서 로컬 모드 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 1.0, 파일 액세스 지연 가중치 = 0)

Fig. 15. FMPI according to LMT in directory activation experiment (storage weight = 1.0, file access delay weight = 0)

../../Resources/kiee/KIEE.2023.72.2.241/fig15.png

그림. 16. 디렉토리 활성화 실험에서 로컬 모드 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 0, 파일 액세스 지연 가중치 = 1.0)

Fig. 16. FMPI according to LMT in directory activation experiment (storage weight = 0, file access delay weight = 1.0)

../../Resources/kiee/KIEE.2023.72.2.241/fig16.png

LMT 값이 크면 파일이 로컬 모드로 변경되는 시점이 늦어지기 때문에 로컬 스토리지 사용율이 늦게 증가한다. 그림16에서는 LMT 값이 작을수록 나은 파일 모드 성능 지수를 보인다. 로컬 모드로 변경되는 파일이 많아지면서 온라인 모드 액세스 비율이 작아지기 때문이다.

그림17 ~ 그림19는 능동 파일 모드 변경 메카니즘의 로컬 스토리지 사용 비율 임계값(SURT)에 따른 파일 모드 성능 지수와 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수 결과를 나타낸다. 디렉토리 활성화 실험에서 SURT 값은 주로 능동 파일 모드 변경 메카니즘이 온라인 모드 파일을 로컬 모드로 변경할 때 증가하게 될 로컬 스토리지 사용율의 상한선을 제한한다. 따라서, SURT 값이 클수록 능동 파일 모드 변경 메카니즘은 더 많은 로컬 스토리지를 사용할 수 있다. 반대로 파일을 온라인 모드로 변경할 때는 SURT 값이 하한선이 되기 때문에 SURT 값이 클수록 온라인 모드로 변경되는 파일은 적어진다. 그림17은 스토리지 사용율과 파일 액세스 지연 비율 가중치가 동일할 때의 파일 모드 성능 지수 그래프이다. 수동 파일 모드 변경 메카니즘은 파일 모드 성능 지수가 0.58이고, 능동 파일 모드 변경 메카니즘은 SURT 값이 0.9일 때 최소값인 0.5가 된다. 능동 파일 모드 변경 메카니즘은 SURT 값이 커질수록 스토리지 사용율은 커지는 반면에 파일 액세스 지연 비율은 줄어들게 되는데, 대체적으로 액세스 지연 비율 효과가 더 크게 작용하는 것으로 분석된다. 그림18은 스토리지 사용율 가중치만 적용했을 때의 파일 모드 성능 지수 그래프이다. 스토리지 사용율 관점에서만 보면, 수동 파일 모드 변경 메카니즘이 디렉토리 비활성화 기간동안 모든 파일들을 온라인 모드인 채로 유지하고, 활성화 기간동안 액세스 할 때만 로컬 모드로 변경되기 때문에 스토리지를 효율적으로 사용한다. 하지만 그림19에서 처럼 파일 액세스 지연 비율 관점에서만 보면, 반대로 그렇기 때문에 수동 파일 모드 변경 메카니즘의 파일 모드 성능 지수는 매우 높다.

그림. 17. 디렉토리 활성화 실험에서 로컬 스토리지 사용 비율 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 0.5, 파일 액세스 지연 가중치 = 0.5)

Fig. 17. FMPI according to SURT in directory activation experiment (storage weight = 0.5, file access delay weight = 0.5)

../../Resources/kiee/KIEE.2023.72.2.241/fig17.png

그림. 18. 디렉토리 활성화 실험에서 로컬 스토리지 사용 비율 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 1.0, 파일 액세스 지연 가중치 = 0)

Fig. 18. FMPI according to SURT in directory activation experiment (storage weight = 1.0, file access delay weight = 0)

../../Resources/kiee/KIEE.2023.72.2.241/fig18.png

그림. 19. 디렉토리 활성화 실험에서 로컬 스토리지 사용 비율 임계값에 따른 파일 모드 성능 지수 (스토리지 가중치 = 0, 파일 액세스 지연 가중치 = 1.0)

Fig. 19. FMPI according to SURT in directory activation experiment (storage weight = 0, file access delay weight = 1.0)

../../Resources/kiee/KIEE.2023.72.2.241/fig19.png

7. 결 론

본 논문에서는 클라우드 스토리지용 파일 동기화 서비스에서 디렉토리 활성화 비율에 따라 파일 모드를 온라인 또는 로컬 모드로 자동으로 변경하는 능동 파일 모드 변경 메카니즘을 제안했다. 또한, 파일 모드 변경 메카니즘의 성능을 분석하기 위해 로컬 스토리지 사용율과 파일 액세스 지연 시간을 고려한 파일 모드 성능 지수를 정의하고, 서로 다른 가중치 및 파라미터에 따른 성능 지수를 수동 파일 모드 변경 메카니즘과 비교 분석했다. 실험 결과, 사용자의 요청 없이는 파일 모드가 변경되지 않는 수동 파일 모드 변경 방식보다 능동 파일 모드 변경 메카니즘의 파일 모드 성능이 전반적으로 우수함을 보였다. 디렉토리가 비활성화되는 상황에서 능동 파일 모드 변경 메카니즘은 마지막 액세스 이후 경과 시간 임계값(AT)과 로컬 스토리지 사용 비율 임계값(SURT)이 작을수록, 그리고 온라인 모드 임계값(OMT)이 클수록 좋은 파일 모드 성능 지수를 나타냈다. 반대로 디렉토리가 활성화되는 경우에는 마지막 액세스 이후 경과 시간 임계값(AT)과 로컬 스토리지 사용 비율 임계값(SURT)이 클수록, 그리고 로컬 모드 임계값(LMT)이 작을수록 좋은 파일 모드 성능 지수를 나타냈다. 향후 연구에서는, 파일의 크기가 다양한 경우 등 더 다양한 파일 액세스 시나리오에서 능동 파일 모드 변경 메카니즘의 성능 분석을 추가로 진행할 예정이다.

Acknowledgements

This work was supported by the National Research Foundation of Korea(NRF) grant funded by the Korea government(MSIT) (No. NRF-2021R1F1A1047032).

References

1 
Dropbox. Smart Sync, Tech. rep, 2017, Available from: https://www.dropbox.com/business/smartsyncGoogle Search
2 
OneDrive. OneDrive, Tech. rep., One Drive Corporation, 2017, Available from: https://onedrive.live.com/Google Search
3 
A. Tridgell, 1999, Efficient Algorithm for Sorting and Synchronization, Ph.D. ThesisDOI
4 
G. Andriani, E. Godoy, G. Koslovski, R. Obelheiro, M. Pillon, 2018, An Architecture for Synchronising Cloud File Storage and Organisation Repositories, Int. J. Parallel Emergent Distrib. Syst., Vol. 34, No. 5, pp. 1-17DOI
5 
I. Drago, E. Bocchi, M. Mellia, H. Slatman, A. Pras, 2013, Benchmarking Personal Cloud Storage, Internet Measurement Conf., pp. 205-212DOI
6 
Z. Li, C. Wilson, Z. Jiang, Y. Liu, B.Y. Zhao, C. Jin, Z. Zhang, Y. Dai, 2013, Efficient Batched Synchronization in Dropbox-like Cloud Storage Services, Middleware Conf., pp. 307-327DOI
7 
S. Han, H. Shen, T. Kim, A. Krishnamurthy, T. Anderson, D. Wetherall, 2015, MetaSync: File Synchronization Multiple Untrusted Storage Services, USENIX Conf. on Usenix Technical Conf., pp. 83-95Google Search
8 
P. G. Lopez, M. Sanchez-Artigas, S. Toda, C. Cotes, J. Lenton, 2014, StackSync: Bringing Elasticity to Dropbox-Like File Synchronization, Middleware Conf., pp. 49-60Google Search
9 
Z. Li, Y. Zhang, Y. Liu, T. Xu, E. Zhai, Y. Liu, X. Ma, Z. Li, 2019, A Quantitative and Comparative Study of Level Efficiency for Cloud Storage Services, ACM Trans. Model. Perform. Eval. Comput. Syst., Vol. 4, No. 3, pp. 1-32DOI
10 
T. Wang, J. Zhou, A. Liu, M. Z. A. Bhuiyan, G. Wang, W. Jia, 2019, Fog-Based Computing and Storage Offloading for Data Synchronization in IoT, IEEE Internet Things J., Vol. 6, No. 3, pp. 4272-4282DOI
11 
A. Wickramarachchi, D. Atapattu, P. Wimalasiri, R. M. Arachchi, G. Dias, 2018, Use of Nomadic Computing Devices for Storage Synchronization, 2018 International Conf. on Information Networking, pp. 673-678Google Search
12 
C. Zhang, D. Qi, W. Li, W. Huang, X. Wang, 2021, SimpleSync: A Parallel Delta Synchronization Method Based on Flink, Concurr. Comput. Pract. Exp., Vol. 33, No. 20DOI
13 
I. Drago, M. Mellia, M. M. Munafo, A. Sperotto, R. Sadre, A. Pras, 2012, Inside Dropbox: Understanding Personal Cloud Storage Services, Internet Measurement Conf., pp. 481-494Google Search
14 
Drive G. Google Drive, Tech. rep., Google Driver Corporation, 2017, Available from: https://www.google.com/drive/Google Search
15 
J. Mościcki, L. Mascetti, 2018, Cloud Storage Services for File Synchronization and Sharing in Science, Education and Research, Future Gener. Comput. Syst., Vol. 78, No. part 3, pp. 1052-1054DOI
16 
A. Bessani, R. Mendes, T. Oliveira, N. Neves, M. Correia, M. Pasin, P. Verissimo, 2014, SCFS: A Shared Cloud- Backed File System, USENIX Conf. on USENIX Annual Technical Conf., pp. 169-180Google Search
17 
S. Ghemawat, H. Gobioff, ST. Leung, 2003, The Google File System, ACM Oper. Syst. Rev., Vol. 37, No. 5, pp. 29-43Google Search
18 
KK. Muniswamy-Reddy, P. Macko, M. Seltzer, 2010, Provenance for The Cloud, USENIX Conf. on File and Storage TechnologiesGoogle Search
19 
H. Duan, S. Yu, M. Mei, W. Zhan, L. Li, 2015, CSTORE: A Desktop-Oriented Distributed Public Cloud Storage, Comput. Electr. Eng., Vol. 42, No. c, pp. 60-73DOI
20 
K. Shvachko, H. Kuang, S. Radia, R. Chansler, 2010, The Hadoop Distributed File System, IEEE Symposium on Mass Storage Systems and Technologies, pp. 1-10Google Search
21 
L. Lamport, 1998, The Part-Time Parliament, ACM Trans. Comput. Syst., Vol. 16, No. issue 2, pp. 133-169DOI
22 
M. Lim, 2020, C2CFTP: Direct and Indirect File Transfer Protocols Between Clients in Client-Server Architecture, IEEE Access, Vol. 8, No. 1, pp. 102833-102845DOI
23 
M. Lim, 2022, A File Synchronization Framework Based on Rsync Protocol for Cloud Storage Services, Trans. Korean Inst. Electr. Eng., Vol. 71, No. 8, pp. 1164-1175Google Search

저자소개

임민규 (Mingyu Lim)
../../Resources/kiee/KIEE.2023.72.2.241/au1.png

He received the B.S. degree in computer science from the Korea Advanced Institute of Science and Technology (KAIST), Daejeon, South Korea, in 1998, the M.S. and Ph.D. degrees in computer science from Information and Communications University (ICU), Daejeon, South Korea, in 2000 and 2006, respectively.

He is currently a Professor with the Department of Smart ICT Convergence, Konkuk University, Seoul, South Korea.

His current research interests include communication middleware and framework, efficient event transmissions, and content distribution in distributed systems.