Thông qua nền tảng phần mềm, được gọi là Photo
Sleuth, Luther tìm cách khám phá những bí ẩn của gần 4 triệu bức ảnh về những
hình ảnh thời Nội chiến có thể tồn tại trong hồ sơ lịch sử.
Luther sẽ trình bày nghiên cứu của mình xung quanh
nền tảng Photo Sleuth vào ngày 19 tháng 3 tại hội nghị Giao diện người dùng
thông minh của Hiệp hội máy tính ở Los Angeles, California. Ông cũng sẽ trình
diễn Photo Sleuth tại lễ khai trương của Bảo tàng Nội chiến Mỹ mở rộng, tại
Richmond, Virginia, vào ngày 4 tháng 5 năm 2019.
Luther, một người yêu thích lịch sử, đã được truyền
cảm hứng để phát triển phần mềm này vào năm 2013 khi đến thăm triển lãm của
Trung tâm Lịch sử Heinz có tên là "Nội chiến Pennsylvania" ở Pittsburgh,
Pennsylvania. Ở đó, ông tình cờ thấy một bức chân dung của Oliver Croxton thời
Nội chiến, ông chú cố-cố của anh, người phục vụ trong Đại đội E của Pennsylvania
thứ 134, mặc đồng phục của một quân đoàn.
"Nhìn thấy người họ hàng xa của tôi nhìn chằm chằm
vào tôi giống như du hành xuyên thời gian", Luther cho biết. "Những bức ảnh lịch
sử có thể cho chúng ta biết rất nhiều về không chỉ lịch sử gia đình của chúng ta
mà còn cho biết những ghi chép lịch sử về khoảng thời gian rộng hơn là chỉ đọc
về sự kiện trong một cuốn sách lịch sử."
Dự án Civil War Photo Sleuth, được tài trợ chủ yếu
bởi Quỹ Khoa học Quốc gia, đã chính thức ra mắt dưới dạng một nền tảng dựa trên
web tại Kho Lưu trữ Quốc gia ở Washington, DC, vào ngày 1 tháng 8 năm 2018 và
cho phép người dùng tải lên ảnh, gắn thẻ chúng với tín hiệu thị giác, và kết nối
chúng với hồ sơ của những người lính Nội chiến với những ghi chép chi tiết về
lịch sử quân sự. Cơ sở dữ liệu tham chiếu ban đầu của Photo Sleuth chứa hơn
15.000 chân dung người lính Nội chiến được xác định từ các nguồn thuộc phạm vi
công cộng như Viện Lịch sử Quân sự Mỹ và các bộ sưu tập tư nhân khác.
Trước khi ra mắt chính thức dự án vào tháng 8, nền
tảng phần mềm đã giành được Thử thách nghiên cứu AI Cloud trị giá 25.000 đô la
và Giải thưởng demo tốt nhất tại hội nghị về tính toán con người và đám đông năm
2018 ở Zurich, Thụy Sĩ, cho Luther và nhóm của ông.
Theo Luther, chìa khóa thành công sau khi ra mắt của
trang web là khả năng xây dựng một cộng đồng người dùng mạnh mẽ. Hơn 600 người
dùng đã đóng góp hơn 2.000 bức ảnh Nội chiến cho trang web trong tháng đầu tiên
sau khi ra mắt, và khoảng một nửa trong số những bức ảnh đó không được xác định.
Hơn 100 bức ảnh chưa biết này được liên kết với những người lính cụ thể và một
phân tích chuyên gia đã phát hiện ra rằng hơn 85% những nhận dạng được đề xuất
này có thể hoặc chắc chắn là chính xác. Hiện tại, cơ sở dữ liệu đã tăng lên hơn
4.000 người dùng đăng ký và hơn 8.000 ảnh.
"Thông thường, nghiên cứu cộng đồng như thế này là
thách thức đối với người mới nếu người dùng không có kiến thức cụ thể về lĩnh
vực chủ đề," Luther cho biết. "Quá trình từng bước gắn thẻ các đầu mối trực quan
và áp dụng các bộ lọc tìm kiếm được liên kết với hồ sơ nghĩa vụ quân sự giúp
công việc thám tử này dễ tiếp cận hơn, ngay cả đối với những người không có kiến
thức sâu về lịch sử quân sự trong Nội chiến."
Nhiệm vụ nhận dạng cá nhân có thể là thách thức
trong nhóm đông người hơn bởi vì có nguy cơ dương tính giả cao hơn. Cách tiếp
cận mới lạ đằng sau Civil War Photo Sleuth dựa trên sự tương tự của việc tìm kim
trong đống cỏ khô. Đường ống dữ liệu có ba thành phần liên quan đến cỏ khô: xây
dựng đống cỏ khô, thu hẹp đống cỏ khô và tìm kim trong đống cỏ khô. Khi kết hợp,
chúng cho phép người dùng xác định những người lính chưa biết trong khi giảm
nguy cơ dương tính giả.
Xây dựng đống cỏ khô được thực hiện bằng cách khuyến
khích người dùng tải lên các hình ảnh được quét ở mặt trước và mặt sau của ảnh
Nội chiến. Bất cứ khi nào người dùng tải lên một bức ảnh để xác định nó, bức ảnh
sẽ được thêm vào kho lưu trữ kỹ thuật số của trang web hoặc "đống cỏ khô", làm
cho nó có sẵn cho các tìm kiếm trong tương lai.
Sau khi tải lên, siêu dữ liệu thẻ người dùng liên
quan đến ảnh như định dạng ảnh hoặc chữ khắc, cũng như các manh mối trực quan,
chẳng hạn như màu áo, chevron, dây đeo vai, phù hiệu cổ áo và phù hiệu mũ. Các
thẻ này được liên kết với các bộ lọc tìm kiếm để ưu tiên các kết quả phù hợp
nhất. Ví dụ, một người lính được gắn thẻ phù hiệu mũ "săn sừng" sẽ gợi ý những
trận đấu tiềm năng từng phục vụ trong bộ binh, trong khi che giấu kết quả từ kỵ
binh hoặc pháo binh. Tiếp theo, trang web sử dụng công nghệ nhận dạng khuôn mặt
tiên tiến để loại bỏ những khuôn mặt trông rất khác biệt và sắp xếp những khuôn
mặt còn lại theo sự tương đồng. Cả hai bước gắn thẻ và nhận dạng khuôn mặt đều
thu hẹp cỏ khô.
Cuối cùng, người dùng tìm thấy kim trong đống cỏ khô
bằng cách khám phá các trận đấu có xác suất cao nhất chi tiết hơn. Một công cụ
so sánh với các điều khiển xoay và thu phóng giúp người dùng kiểm tra cẩn thận
một trận đấu có thể và, nếu họ quyết định đó là một trận đấu, thì liên kết ảnh
chưa biết trước đó với thông tin nhận dạng và tiểu sử mới.
Truy xuất ảnh lịch sử trong Nội chiến thông qua phần
mềm nhận dạng khuôn mặt như Photo Sleuth cũng có các ứng dụng rộng rãi ngoài
việc xác định ảnh lịch sử. Phần mềm này có khả năng tạo ra những cách mới để suy
nghĩ về việc xây dựng các hệ thống nhận dạng con người bên cạnh việc việc nhận
diện khuôn mặt.
Thanh Vân (Eurekalert)