2024年10月27日

字幕檔格式 *.srt *.lrc

 大家所熟知的字幕檔格式是 .srt

1
00:00:00,000 --> 00:00:04,700
大家好 歡迎來到楊匹托課的三分鐘小路用
2
00:00:04,700 --> 00:00:07,500
經濟學是一門有趣的知識
3
00:00:07,500 --> 00:00:10,800
它常常提供我們想不到的觀點

而YouTube 支援的字幕檔案格式

格式名稱副檔名更多資訊
SubRip.srt僅支援最基本的版本,無法識別任何樣式資訊 (標記)。檔案必須為純 UTF-8 編碼。
SubViewer.sbv 或 .sub僅支援最基本的版本,無法識別任何樣式資訊 (標記)。檔案必須為純 UTF-8 編碼。
MPsub (MPlayer 字幕).mpsub支援「FORMAT=」參數。
LRC.lrc無法識別任何樣式資訊 (標記),但支援增強格式。
Videotron Lambda.cap主要用於日文字幕。

 如想充分控管字幕樣式 (標記) 或位置,請使用以下檔案格式。

格式名稱副檔名更多資訊
SAMI (同步可存取媒體交換).smi 或 .sami僅支援時間碼、文字與簡易標記 (<b>、<i>、<u> 和
<font> 中的 color= 屬性)。不支援位置資訊。
RealText.rt僅支援時間碼、文字與簡易標記 (<b>、<i>、<u> 和
<font> 中的 color= 屬性)。不支援位置資訊。
WebVTT.vtt目前仍在初步實行階段。支援位置資訊,但由於 CSS 類別名稱尚未標準化,因此樣式僅限於 <b>、<i>、<u>。
TTML (時控文本標記語言).ttml目前尚未完全實行。SMPTE-TT 擴充功能支援 CEA-608 功能。支援 iTunes Timed Text (iTT) 檔案格式;iTT 是 TTML 1.0 版的子集。支援樣式與位置資訊。
DFXP (發布格式交換設定檔).ttml 或 .dfxp這兩個檔案類型會解譯為 TTML 檔案。


劇作家隱藏式輔助字幕 (.scc 副檔名) 檔案是YT建議的檔案格式。這類檔案能精確呈現 CEA-608 資料的內容,因此是採用 CEA-608 功能的字幕的首選格式。
字幕檔案格式 ass 適合比較複雜的字幕
LRC格式,相對也簡單,如下:
[00:12.00]第一行歌词
[00:17.20]F: 第二行歌词
[00:21.10]M: 第三行歌词
[00:24.00]第四行歌词
[00:28.25]D: 第五行歌词
[00:29.02]第六行歌词


2024年10月12日

靜音鍵盤

錄音時,鍵盤會發出微微吵人的聲音,感覺不太理想。找了靜音鍵盤。才發現鍵盤也有大學問。

據YT影片比較 (https://youtu.be/XrCwR_XQy_4?si=UI9uQBPBlGx8d7pk),聲音大小是

(Cherry MX 軸音量排名)

靜音紅軸 < 黑軸 < 紅軸 < 茶軸 < 青軸 

還有可以熱插拔,可換任意軸的鍵盤

不需要右邊數字鍵的話,可以選 TLK 鍵盤 (Ten Key Less), 尺寸大小和功能鍵多寡

品牌:Cherry, 艾瑞克 iRock (https://www.i-rocks.com.tw/web/index/index.jsp?lang=tw), DUCKY ONE 2 冷門的Mistel和Vortex

(要靜音,建議麥克風收音可以不要放桌上)

考慮:

有線 Cherry MX Board 3.0S RGB TKL $2,290() 有線 Cherry MX 1.1 RGB TKL $2,490()

不低價:

羅技G G913 TKL 無線 80%機械式電競鍵盤 NT$4,490

有發票:

無發票

肥貓鍵客一號店

2024年8月30日

免費AI模型試驗場:huggingface.co

沒聽過 huggingface.co ?

這是一個很有名的免費AI模型試驗場。可以先試試看某個模型對你有沒有用,再決定下載在本機電腦來使用。

我試過漫畫產生器

ai-comic-factory

產生如下,還滿有趣的。



==設定==

You can create a repository from the CLI (skip if you created a repo from the website)

$pip install huggingface_hub
#You already have it if you installed transformers or datasets

$huggingface-cli login
#Log in using a token from huggingface.co/settings/tokens
#Create a model or dataset repo from the CLI if needed
$huggingface-cli repo create repo_name --type {model, dataset, space}

Clone your model, dataset or Space locally

#Make sure you have git-lfs installed
#(https://git-lfs.github.com)
$git lfs install
$git clone https://huggingface.co/username/repo_name

Then add, commit and push any file you want, including larges files

# save files via `.save_pretrained()` or move them here
$git add .
$git commit -m "commit from $USER"
$git push

In most cases, if you're using one of the compatible libraries, your repo will then be accessible from code, through its identifier: username/repo_name

For example for a transformers model, anyone can load it with:

tokenizer = AutoTokenizer.from_pretrained("username/repo_name")
model = AutoModel.from_pretrained("username/repo_name")

2024年7月6日

磁碟很快滿!?改變 docker,flakpak,

在AI 的開發世界,非 windows 的環境應該是主流了。但不同的OS版本和開發環境套件版本,經常不相容而造成使用上的困難。

很多應用程式套件想出了各種方法 (像我正在使用的 docker,flakpak,snapd...),讓軟體可以在眾多Linux發行版(ubuntu、redhat、debian、openSUSE、Fedora,..., etc. see: https://distrowatch.com/)上正常執行。這些都不同於傳統的Linux套件管理方法,但可以讓各種有用的軟體,可很方便地在你的非 windows OS 中應用。

當然缺點就是會佔據很大的硬碟空間,若你經常備份整台電腦,這種套件愈多,會讓備分時間備增而不便。

以下先紀錄這些套件在本地電腦 mint OS 的預設儲存位置,以便在備份時排除之。

/var/lib/socker

/var/flatpak

/var/snapd

/usr/ollama

2024年3月29日

鎖算力的顯卡,對機器學習深度學習這類AI應用有影響嗎?

挖礦潮來臨時,顯卡被炒上了天,高昂的顯卡價格讓不少人望洋興嘆。

英偉達推出了為防止挖礦的鎖算力的顯卡。於是問題就來了,鎖算力的顯卡,對平時玩遊戲和機器學習深度學習這類AI應用有影響嗎?

某東購物網站上看了下鎖算力的30系列顯卡。然後點開了在線客服的聊天窗口。首先問:鎖算力的顯卡,對機器學習這類應用有影響不?回答:沒有影響。那麽,是不是只對挖礦有影響,玩遊戲和搞機器學習深度學習都不影響?

回答:只限制了哈希算力。

完成hash碰撞的就是哈希算力,比特幣挖礦的運算則是完成相關算法的過程。比特幣挖礦采用的是SHA-256哈希值運算,這種算法會進行大量的32位整數循環右移運算。AI,深度學習之類的項目運算,大多數的深度學習模型使用的是32位單精度浮點數(FP32)來進行訓練,還有一些是用float16和float64。所以,比特幣挖礦和AI深度學習有點井水不犯河水。鎖算力與否,理論上並沒影響。

不過貌似需要CUDA的版本是11.0以上。至於是否影響玩遊戲,則要看那些實測測評的。機智客看到網上有人在一定的其他硬件配置下,分別用RTX3060原版和鎖算力版做了對比。結果顯示,兩張顯卡在性能表現上幾乎完全一致,大家可以參考。


摘要自 url: https://www.163.com/dy/article/GGG0NC7I0511SIE3.html

2024年3月13日

讓 Virtualbox 虛擬機 掛載 隨身碟/實體硬碟

 Virtualbox 虛擬機可否掛載,甚至從隨身碟/實體硬碟開機?

可以!要利用 virtualbox 下的 vmdk 格式,來連結實體 USB/硬碟

1. 連結實體連結

在 Windows 的命令提示終端機下指令

VBoxManage internalcommands createrawvmdk -filename D:\VirtualBox\usbboot.vmdk -rawdisk \\.\PhysicalDrive1

Ubuntu/Mint 下終端機下指令

VBoxManage internalcommands createrawvmdk -filename /path/part1.vmdk -rawdisk /path/PhysicalDrive1

在 virtualbox 的虛擬媒體管理員下,建立媒體。之後就可用了




2023年3月31日

難懂的密碼? 初探神奇的 regex 語法

 regex 語法

正規表達式(Regular Expression,簡稱 regex)是一種用於描述字串規律的表示法,可應用在文本搜索、替換、驗證、分割等各種字串操作中。Regex 語法是由特殊字符和普通字符組成的,其主要作用是匹配目標字串中符合特定規律的子字串。最後介紹一些常見的 regex 語法。

使用情境:

我有多個考題,文字格式如下:

1. 若一虛無假設H0: μ = h,若 t 檢定之值 = tB,而查表得知臨界值為 tr>,且 |tB| > tR,則我們可以推論?
a. 無法拒絕此虛無假設
b. 要再進行另一個檢定才能判定
c. 應拒絕此虛無假設
d. 該檢定是偽陽性

2. 利用p值判斷時,若主觀顯著水準 = 5%,則某一檢定之 p 值 = 0.08 時,我們可以推論?
a. 應拒絕此虛無假設
b. 要再進行另一個檢定才能判定
c. 無法拒絕此虛無假設
d. 該檢定是偽陰性


我想將題目獨立一行,4個答項合併成一行,用 regex 語法來取代

(a) 搜尋以 b. c. d. 為開頭的 regex 

\n([b-d]\.)\s*

這意思是,是用來匹配以 b.、c.、d. 開頭的一行文本,並將其與下一行文本合併為同一行。

具體來說,這個正則表達式包含了以下部分:

  • \n:匹配換行符(newline)。
  • ([b-d].):匹配以 a.、b.、c.、d. 開頭的字串,其中 [a-d] 匹配 a 到 d 之間的任何一個字符,. 匹配一個句點。
  • \s*:匹配零個或多個空白字符(包括空格、制表符等)。

(b) 將使用了'(\1)',表示插入捕獲組所匹配到的文本

結果:

1. 若一虛無假設H0: μ = h,若 t 檢定之值 = tB,而查表得知臨界值為 tr>,且 |tB| > tR,則我們可以推論? (a. ) 無法拒絕此虛無假設 (b. ) 要再進行另一個檢定才能判定 (c. ) 應拒絕此虛無假設 (d. ) 該檢定是偽陽性
2. 利用p值判斷時,若主觀顯著水準 = 5%,則某一檢定之 p 值 = 0.08 時,我們可以推論? (a. ) 應拒絕此虛無假設 (b. ) 要再進行另一個檢定才能判定 (c. ) 無法拒絕此虛無假設 (d. ) 該檢定是偽陰性

可是,還不確定b.後為何多了一個空格

常用 regex 語法解釋

1. 字符集合:使用方括號表示一組可能的字符。例如,[abc] 表示匹配字符 a、b、c 中的任意一個字符。

2. 點:用點符號 . 表示任何一個字符。

3. 重複:用花括號 {} 表示某個字符出現的次數。例如,a{3} 表示匹配三個 a。

4. 或:使用竖线符號 | 表示“或”關係。例如,a|b|c 表示匹配 a 或 b 或 c。

5. 開始和結束:使用^表示字串開始位置,$表示字串結束位置。例如,^abc 表示匹配以 abc 開始的字串。

6. 分組:使用小括號 () 將多個字符分成一組。例如,(abc)+ 表示匹配一個或多個由 abc 組成的字串。

7. 通配符:在字符集合中使用 ^ 表示除了某個字符之外的其他字符。例如,[^abc] 表示匹配除了 a、b、c 以外的任意字符。

8. 轉義:有些字符具有特殊意義,在正則表達式中需要使用反斜杠 \ 轉義才能表示其本身。例如,\d 表示匹配任意一個數字字符。