ASTERISK LAB - Automatic speech recognition - Speech synthesis

ASTERISK LAB

Subscribe to RSS feed

Sticky post

Welcome Asterisk Lab

hidden statistics
Diễn Đàn Asterisk Chính Thức Hoạt Động
http://www.04hcb.net
http://www.giaiphapthongminh.com.vn
Chào Mừng đến với trang blog trao đổi về Asterisk, Trong thời gian qua Asterisk đối với Tôi thật thân thiết bởi đây là lĩnh vực mà Tôi rất yêu thích. Kiến thức thì bao la còn hiểu biết của mỗi người thì có giới hạn, vì thế qua trang blog này Tôi rất mong muốn được chia sẽ và trao đổi cùng các Bạn để chúng ta cùng nhau hoàn thiện hơn.
idea Chia sẽ là niềm vui idea [/SIZE]
Download trên BOX.NET khi hết băng thông

Chúc mừng tết nhâm thìn 2012

Một năm nữa lại đến, cầu mong mọi đều tốt lành sẽ đến.











Lập trình component theo mẫu thiết kế MVC trong joomla

MVC (Model - View - Controler)
Mô hình mẫu thiết kế MVC giúp cho các dòng code của chúng ta rõ ràng và dễ bảo trì bảo dưỡng, tránh sự nhập nhằng giữa tầng xử lý, tầng hiển thị và tiếp nhận thông tin.

Model : làm nhiệm vụ truy xuất dữ liệu và xử lý tác vụ
View : lo phần hiển thị và tiếp nhận thông tin.
controler: đảm bảo điều khiển cho mô hình hoạt động.

Read more...

Giải pháp thông minh - Tổng đài IP thông minh

Tổng đài IP thông minh giảm chi phí liên lạc vì dựa trên hạ tầng mạng đã có sẵn.
Có nhiều tính năng mà hệ thống tổng đài PBX bình thường không có được.
Tổng đài IP Thông minh cung cấp nhiều tính năng đem lại nhiều tiện ích cho khách hàng:
- Gọi điện hoàn toàn miễn phí giữa các chi nhánh của công ty tại bất cứ đâu, kể cả trên thế giới.
- Tận hưởng khả năng gọi điện thoại bằng giọng nói của tổng đài IP Thông minh.
- Tra cứu nhanh lịch công tác của công ty
- Nhận fax trực tiếp và chuyển qua e-mail .
- Tự động nhắc việc bằng giọng nói.
- Ghi âm lại các cuộc gọi .
- Từ chối cuộc gọi khi không cần thiết
- Chuyển cuộc gọi đến số điện thoại mong muốn.
- Hệ thống chăm sóc khách hàng tiện lợi.
- Các giải pháp điện thoại theo yều cầu của doanh nghiệp
Các bước triển khai hệ thống tổng đài IP thông minh:
1. Nhu cầu số lượng máy điện thoại của công ty, chọn thiết bị giao tiếp với mạng PSTN.
2. Chọn loại tổng đài IP thông minh phù hợp với nhu cầu của doanh nghiệp
3. Chọn các thiết bị đầu cuối kết nối vào hệ thống tổng đài.
4. Lắp đặt cấu hình và hướng dẫn sử dụng.

Chi tiết xem tại : http://www.giaiphapthongminh.com.vn

Tết Tân Mão 2011

Tết nay Thảo Nguyên đi chợ tết, Phụ Ông bà nấu Bánh tét, chúc tết Ông Bà. Một cái tết vui tươi đầm ấm bên gia đình.
Thảo Nguyên Phụ làm Bánh tét với Bà Nội
Thảo Nguyên Chúc Tết Ông Bà
Thảo Nguyên Đi chơi chợ tết
















Tổng đài điện thoại kể chuyện Bác Hồ - chương trình cuộc sống quanh ta của HTV

Kết nối trang blog với facebook

Kết nối trang blog với facebook

Tổng đài điện thoại kể chuyện Bác Hồ

TT - Đoàn khối bưu chính viễn thông TP.HCM vừa trình làng tổng đài SSS - tìm hiểu tấm gương đạo đức Hồ Chí Minh. Điều đặc biệt, tổng đài này nhận diện yêu cầu bằng... giọng nói. Lưu ý một điều là hệ thống làm việc tốt trong môi trường không có tiếng ồn.


Nhóm thiết kế tổng đài “Học tập và làm theo tấm gương đạo đức Hồ Chí Minh” - Ảnh: K.ANH

Hiện tổng đài đã được đưa vào sử dụng bước đầu gồm những phần gắn liền với cuộc vận động “Tuổi trẻ Việt Nam học tập và làm theo lời Bác”.

08.5445.6122 và chuyện về Bác

Bấm số điện thoại 08.5445.6122, bạn sẽ nhận được thông điệp của tổng đài “Chào mừng bạn gọi đến hệ thống tổng đài học tập và làm theo tấm gương đạo đức Bác Hồ”. Hệ thống tiếp tục hướng dẫn chọn những nội dung bạn cần tìm hiểu (gồm các phần: thông tin về thân thế, cuộc đời, sự nghiệp của Bác; những mẩu chuyện về tấm gương đạo đức Hồ Chí Minh, những lời dạy, bài nói chuyện của Bác; những ca khúc về Chủ tịch Hồ Chí Minh) bằng cách đọc các chữ số ứng với mỗi yêu cầu.

Năm thành viên chính đã tranh thủ giờ nghỉ trưa, sau giờ làm việc để thiết kế tổng đài này. Để tổng đài tự động nhận diện giọng nói dễ dàng, cả nhóm đã thu âm hàng ngàn giọng nói khác nhau. “Cả nhóm tranh luận, tìm hiểu và ứng dụng công nghệ nhận diện giọng nói vào tổng đài. Chúng tôi mong tổng đài góp phần đưa cuộc vận động học tập và làm theo lời Bác đến nhiều người hơn. Tổng đài cũng rất phù hợp để hỗ trợ những bạn khiếm thị”- anh Lê Quốc Toàn chia sẻ.
Hơn một năm vừa làm vừa... thất bại rồi sửa, cuối cùng tổng đài đã thành hình và được đưa vào sử dụng miễn phí. Chính công việc này đã tác động đến những người thực hiện. “Qua chuyện về Bác, khi làm việc gì tôi cũng suy nghĩ phải làm hết sức cũng như tìm cách tiết kiệm nhất”- bạn Nguyễn Mai Phương, làm việc tại văn phòng Đảng - đoàn thể khối bưu chính viễn thông TP.HCM, cho biết. Thời gian tới các bạn sẽ phát triển thêm các chuyên mục như nêu gương sáng các bạn trẻ “làm theo lời Bác”, tổ chức các cuộc thi tìm hiểu dạng trắc nghiệm để thu hút nhiều người tham gia...

“Cần”, “kiệm” theo lời Bác dạy

Anh Trần Công Nhân, bí thư Đoàn khối bưu chính viễn thông TP.HCM, cho biết: “Tùy vị trí công việc của mình trong từng đơn vị, các bạn sẽ tự chọn những công trình, phần việc “làm theo lời Bác” ứng với lời dạy “cần, kiệm, liêm, chính, chí công vô tư”. Gắn với lời dạy “cần” của Bác, nhiều bạn trẻ đã làm thêm giờ để giải quyết các công việc tồn đọng, đẩy nhanh tiến độ, tăng năng suất lao động... Chi đoàn khối văn phòng đã thực hiện công trình “Tin học hóa chương trình quản lý bưu cục” góp phần làm tốt hơn công tác quản lý cho đơn vị. Còn Đoàn cơ sở Công ty điện thoại Tây thành phố lại có công trình “Thu hồi, kiểm tra chất lượng 5.000m cáp để tái sử dụng”...

Lời dạy “kiệm” của Người được các bạn thực hiện nhiều nhất. Riêng công trình “Tái sử dụng túi đựng bưu phẩm, bưu kiện” của Đoàn cơ sở Trung tâm Sài Gòn tiết kiệm được hơn 50 triệu đồng. Mới đây, Đoàn khối còn thực hiện công trình bán bảo hiểm xe gắn máy gây quỹ ủng hộ chương trình “Ước mơ của Thúy” do báo Tuổi Trẻ thực hiện nhằm chăm lo cho bệnh nhi ung thư...

Có lẽ công trình nhân văn nhất của các bạn trẻ bưu chính viễn thông là duy trì việc sửa chữa máy vi tính cũ đem tặng các bạn ở vùng sâu vùng xa. Những chiếc máy đến kỳ thanh lý được Đoàn khối xin về, các bạn trẻ giỏi công nghệ thông tin dành ngày nghỉ sửa chữa thành những chiếc máy sử dụng được. Và bốn năm qua, đã có hơn 200 chiếc máy vi tính như thế được các bạn mang đến tận vùng biên giới và trực tiếp đứng lớp dạy tin học cho những bạn chưa một lần biết máy vi tính là gì! “Chia sẻ với những hoàn cảnh khó khăn cũng là cách để các bạn trẻ thấy ý nghĩa việc mình làm”- anh Nhân cho biết.

95 công trình thanh niên “làm theo lời Bác”

Bốn năm thực hiện cuộc vận động “Tuổi trẻ học tập và làm theo lời Bác”, Đoàn khối bưu chính viễn thông TP.HCM đã thực hiện 95 công trình “làm theo lời Bác”. Đa số công trình tập trung nâng cao năng suất lao động, thực hành tiết kiệm, chống lãng phí, góp phần thực hiện nhiệm vụ đơn vị. Có 90 bạn trẻ được tuyên dương “Thanh niên bưu chính viễn thông làm theo lời Bác”.

KIM ANH

Nguồn Tin : http://tuoitre.vn/nhip-song-tre/411287/tong-dai-dien-thoai-ke-chuyen-bac-ho.html

Tự động chạy chương trình lúc khởi động linux - startup - auto start during boot time linux

Ví dụ cần chạy chương trình abc đặt tại thư mục /usr/local/bin/abc file cấu hình /etc/abc.conf khi khởi động linux.
Các bước thực hiện như sau:

1. Tạo tập tin abcboot có nội dung như sau:

#!/bin/bash
#
# Chay tu dong Chuong trinh abc
# abc.
#
#chkconfig: 3 55 45
# description: abc \
# Chay chuong trinh abc
#file khoi dong chuong trinh abc luc boot may

if test -x /usr/local/bin/abc -a -f /etc/abc.conf
then
echo "Starting abc"
/usr/local/bin/abc
exit 1
fi
exit 0



2. Chép tập tin abcboot vào thư mục /etc/init.d
3. Thực hiện lệnh sau cho tập tin abcboot có thể chạy: #chmod 744 abcboot
4. Đưa vào khởi động tại level 3 - runlevel 3 có nghĩa là "Multi-User Mode with Networking"
#cd /etc/rc.d/rc3.d
#ln -s ../init.d/abcboot S99abcboot

5. Đánh lệnh #reboot để khởi động lại máy tính
6. Xem kết quả chương trình đã chạy chưa bằng lệnh: #ps ax | grep abc

Hết.
Toàn Sưu tầm

Test nhận dạng chữ số tiếng nói Tiếng việt - Speech server

Đã làm xong phần cơ Bản Nhận dạng chữ số tiếng nói tiếng Việt. Chương trình Bé học làm toán với phép cộng và phép trừ, Mời các bạn quan tâm cùng test. Cách test hệ thống nhận dạng chữ số tiếng nói tiếng việt Speech Server như sau:

1. Gọi điện thoại đến số 0835515582 sẽ nghe thông điệp "Chào mừng đến với hệ thống nhận dạng chữ số tiếng nói tiếng việt mời bạn đọc một số Điện thoại để bắt đầu chương trình"
2. Sau tiếng Beep Bạn hãy đọc một số điện thoại để Bắt đầu chương trình.
3. Tiếp theo Hệ thống sẽ phát thông Điệp "Chương trình Bé Học làm toán bắt Đầu" chương trình sẽ phát một phép toán cộng hoặc trừ một cách ngẫu nhiên ví dụ: "Một Cộng Một Bằng"
4. Bạn sẽ trả lời "hai" thì hệ thống sẽ phát ra thông điệp chúc mừng Bạn trả lời Đúng, nếu bạn trả lời số khác ví dụ "bốn" Thì hệ thống sẽ phát ra thông điệp sai.
5. Hệ thống sẽ phát ra liên tục đến khi Bạn gác máy kết thúc.

=> Đây là bước đầu thử nghiệm mong các Bạn ủng hộ để hệ thống tiếp tục phát triển. Chúc Các Bạn thật nhiều niềm vui.

Lab cơ bản nhận dạng tiếng nói với HTK - ASR

1. Tạo cú pháp nhận dạng hay còn gọi là ngữ cảnh nhận dạng.
Soạn tập tin gram.txt có nội dung như sau:
$speaker = toan | phuong;
($speaker)
nhận dạng khi người nói vào hệ thống tên Toàn hoặc tên Phương.

2. Tạo sơ đồ wdnet - word network
Phát sinh file wdnet bằng lệnh:
>HParse gram.txt wdnet
Nội dung của file wdnet như sau:
VERSION=1.0
N=5 L=5
I=0 W=!NULL
I=1 W=!NULL
I=2 W=toan
I=3 W=!NULL
I=4 W=phuong
J=0 S=3 E=1
J=1 S=0 E=2
J=2 S=2 E=3
J=3 S=4 E=3
J=4 S=0 E=4

3. Thu âm giọng nói: có hai cách làm
a. Thu âm giọng nói rồi tạo file text tương ứng.
b. Phát ra nội dung câu nói trước sau đó thu âm theo nội dung đó.
Phát ra nội dung thu âm bằng lệnh:
>HSGen -l -n 20 wdnet dict >prompst
Nội dung file dict như sau:
phuong [phuong] ph uo n g
toan [toan] t o a n

File prompst chứa nội dung 50 tập tin để thu âm, thu âm 40 câu để huấn luyện, và 10 câu làm dữ liệu test.
nội dung file prompst như sau:
1. phuong
2. toan
3. toan
.........
Dùng phần mềm audacity để thu âm.

4. Trích đặc trưng mfcc dùng lệnh HCopy

>HCopy -T 1 -C cfg\HCopy.cfg -S listwavmfccTrain.scp
Ghi chú:
+ File Hcopy.cfg có nội dung:
SOURCEKIND = WAVEFORM
SOURCEFORMAT = WAV
TARGETKIND = MFCC_0_D_A
TARGETRATE = 100000.0
SAVECOMPRESSED = T
SAVEWITHCRC = T
WINDOWSIZE = 250000.0
USEHAMMING = T
PREEMCOEF = 0.97
NUMCHANS = 26
CEPLIFTER = 22
NUMCEPS = 12
ENORMALISE = F
+ File listwavmfccTrain.scp có được bằng cách thực hiện lệnh:
>listwavmfc.pl wav\train listwavmfccTrain.scp
F:\labsimple\wav\train\01.wav F:\labsimple\wav\train\01.mfc
F:\labsimple\wav\train\02.wav F:\labsimple\wav\train\02.mfc
...............

5. Khởi tạo giá trị huấn luyện

>HCompV -C cfg\HCompV.cfg -f 0.01 -m -S train.scp -M hmm\hmm0 hmm\hmm0\proto
Ghi chú:
+ File train.scp có nội dung:
F:\labsimple\mfcc\train\01.mfc
F:\labsimple\mfcc\train\02.mfc
.............................
+ Tạo file proto trong thư mục hmm\hmm0 có nội dung:
~o <VecSize> 39 <MFCC_0_D_A>
~h "proto"
<BeginHMM>
<NumStates> 5
<State> 2
<Mean> 39
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0
<Variance> 39
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
1.0 1.0 1.0
<State> 3
<Mean> 39
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0
<Variance> 39
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
~o <VecSize> 39 <MFCC_0_D_A>
~h "proto"
<BeginHMM>
<NumStates> 5
<State> 2
<Mean> 39
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0
<Variance> 39
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
1.0 1.0 1.0
<State> 3
<Mean> 39
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
0.0 0.0 0.0
<Variance> 39
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
+ tạo file hmmdefs trong thư mục hmm\hmm0, sao cho mỗi phone được thay bằng "proto"
>prompts2mlf.pl lable.mlf train
+ file lable.mlf nội dung:
#!MLF!#
"*/1..lab"
phuong
.
"*/2..lab"
toan
.
....................
+ file train
1. phuong
2. toan
....................

>HLed -l '*' -d dict -i phones0.mlf mkphones.led lable.mlf
+ file mkphones.led có nội dung
EX
IS sil sil
DE sp

+lệnh trên sẽ tạo ra file phones0.mlf

>HDMan -A -D -T 1 -m -w wlist -n monophones0 -i -l dlog dict lexicon
+ File lexicon có nội dung:
phuong [phuong] ph uo n g
toan [toan] t o a n
silence [] sil
+ Lệnh trên sẽ tạo ra file monophones0

>mkHmmdefsFile.pl hmm\hmm0\proto monophones0 hmm\hmm0\hmmdefs
+ Lệnh trên tạo file hmmdefs
+ Nội dung của File macros có được từ cách chép phần đầu ~o của file proto và nội dung của file vFloors
~o
<STREAMINFO> 1 39
<VECSIZE> 39<NULLD><MFCC_D_A_0><DIAGC>
~v varFloor1
<Variance> 39
2.909618e-001 1.896888e-001 3.646610e-001 2.376805e-001 2.649882e-001 2.794672e-001 2.323876e-001 2.089114e-001 1.858883e-001 2.667808e-001 2.119271e-001 1.591346e-001 2.950959e-001 7.393611e-003 6.921536e-003 7.833419e-003 9.061966e-003 1.120140e-002 1.136315e-002 1.120127e-002 1.078344e-002 1.207254e-002 1.367865e-002 1.039116e-002 8.883036e-003 4.715052e-003 8.632476e-004 1.064687e-003 1.218992e-003 1.529570e-003 1.798744e-003 1.806864e-003 1.898874e-003 1.988898e-003 2.171315e-003 2.347129e-003 1.784228e-003 1.629085e-003 5.131669e-004

6. Ước lượng thông số:

>HERest -C cfg\HERest.cfg -I phones0.mlf -t 250.0 150.0 1000.0 -S train.scp -H hmm\hmm0\macros -H hmm\hmm0\hmmdefs -M hmm\hmm1 monophones0
>HERest -C cfg\HERest.cfg -I phones0.mlf -t 250.0 150.0 1000.0 -S train.scp -H hmm\hmm1\macros -H hmm\hmm1\hmmdefs -M hmm\hmm2 monophones0
>HERest -C cfg\HERest.cfg -I phones0.mlf -t 250.0 150.0 1000.0 -S train.scp -H hmm\hmm2\macros -H hmm\hmm2\hmmdefs -M hmm\hmm3 monophones0


7. Kết Quả

>HVite -H hmm\hmm3\macros -H hmm\hmm3\hmmdefs -S test.scp -i kq\recout.mlf -w wdnet -p 0.0 -s 5.0 dict HmmList
8. Đánh giá

>HResults -I phones0test.mlf hmmlist kq\recout.mlf
Ghi chú:
+file phones0test.mlf
#!MLF!#
"F:/labsimple/mfcc/test/41.lab"
toan
.
"F:/labsimple/mfcc/test/42.lab"
phuong
.
...............................

====================== HTK Results Analysis =======================
Date: Sat Jul 17 15:04:02 2010
Ref : phones0test.mlf
Rec : kq\recout.mlf
------------------------ Overall Results --------------------------
SENT: %Correct=100.00 [H=10, S=0, N=10]
WORD: %Corr=100.00, Acc=100.00 [H=10, D=0, S=0, I=0, N=10]
===================================================================

=> OK tất cả đều tuyệt vời nhận dạng chính xác 100% luôn.

Download: http://www.mediafire.com/?gqyfyrbo7h8cfg6

Hello lý thuyết xác suất - công thức bayes



Bài toán : Lớp học có 30 học sinh, trong đó có 17 Nữ và 13 Nam, trong lớp có 3 bạn tên Thảo trong đó có 2 bạn Nam và 1 bạn Nữ.(như hình vẽ)

1. Thầy giáo gọi bất kỳ một bạn tên Thảo lên Bảng trả Bài thì xác xuất gọi đúng tên Bạn Thảo là bao nhiêu? =>Tất nhiên là 3/30 rồi bởi trong lớp có 30 Bạn và có 3 bạn tên là Thảo.

2. Thầy giáo gọi bất kỳ một bạn Nữ lên Bảng trả Bài câu hỏi là xác xuất để bạn đó tên Thảo là bao nhiều? => tất nhiên là 1/17 rồi vì trong lớp chỉ có 1 Bạn Nữ tên Thảo, và ta cũng biết trong lớp có 17 bạn Nữ.

+ Chúng ta xét kỹ hơn các trường hợp với ngôn ngữ hình thức: gọi sự kiện A = "tên là Thảo" và Điều kiện B ="Nữ" ta có A = 3 tức là trong không gian mẫu 30 phần tử (học sinh) có 3 Bạn tên là Thảo, B = 17 có nghĩa là trong lớp có 17 Bạn là Nữ. P(A)= (số Bạn tên là Thảo)/(Số bạn trong lớp) = 3/30 tức là xác xuất gọi tên Bạn Thảo lên Bảng. Đây là công thức tính xác xuất cổ điển với các sự kiện sơ cấp là bình đẳng như nhau.

+ Mặt khác ta cũng có (A Giao B) = 1 (A giao với B lấy phần tử chung nằm trong cả A lẫn B)

xác suất Bạn tên thảo trong lớp học gồm 30 người là P(A Giao B)=1/30. Bây giờ chúng ta cần biết chính xác Bạn tên thảo với điều kiện là Nữ chiếm xác xuất là bao nhiêu? P(A|B)=P(A Giao B)/P(B) = (1/30)/(17/30) = 1/17 = (xác xuất của bạn Nữ tên Thảo trong lớp học)/(Xác xuất Bạn đó là Nữ) = xác xuất bạn đó tên Thảo với điều kiện là Nữ. Công thức trên chính là công thức xác xuất có điều kiện.

+ Tiếp theo Thầy giáo gọi Bạn tên là Thảo lên Bảng hỏi xác xuất để Bạn đó Nữ là bao nhiêu?
Như chúng ta biêt có tất cả 3 bạn tên là Thảo trong đó có 1 Bạn nữ vậy xác xuất bạn đó là Nữ với điều kiện tên Thảo là 1/3. P(B|A) = P(A Giao B)/P(A) = (1/30)/(3/30) = 1/3. P(A) là xác xuất bạn có tên Thảo trong lớp học.

Ta nhận thấy P(A giao B) = P(B|A).P(A) = (1/3).(3/30) = P(A|B).P(B)=(1/17).(17/30)=1/30
có nghĩa là P(B|A).P(A)=P(A|B).P(B) => P(B|A)=P(A|B).P(B)/P(A) Đây chính là công thức Bayes

Nhập môn nhận dạng tiếng nói - Automatic speech recognition

Nhận dạng tiếng nói - chuyển lời nói thành văn bản ( Speech to text ) đã bắt đầu nghiên cứu từ những năm 50 [1], Đây là một lĩnh vực khá thú vị nhưng để ứng dụng vào cuôc sống vẫn còn là mới mẻ tại việt Nam. Vậy nên rất cần nhiều ứng dụng thực tế cho những Ai muốn nghiên cứu tìm hiểu áp dụng vào cuộc sống.

Bài nhập môn này Mình ghi lại những kiến thức cần thiết cho bước đầu nhập môn vào lĩnh vực này, để khỏi bỡ ngỡ khi đứng trước một rừng kiến thức, cái nào cũng cần thiết.

Nhận dạng tiếng nói - Automatic speech recognition cần trang bị một số kiến thức nền như: kiến thức về xác suất, xác xuất có điều kiện, công thức bayes, Đại số tuyến tính, phân phối chuẩn( Normal distribution ) hay còn gọi là phân phối gauss( Gaussian distribution ), thuật toán K-means, mô hình markov ẩn( Hidden Markov Model-HMM ), mô hình hợp gausss ( Gaussian Mixture Model - GMM ), mô hình ngôn ngữ (N-gram), Xử lý tín hiệu số, phương pháp rút trích đặc trưng tiếng nói ( Mel-frequency cepstral coefficients - MFCC )... Một công cụ toolkit để hiện thực nhận dạng tiếng nói không thể thiếu đó là HTK ( Hidden Markov Model Toolkit ) - Speech Recognition Toolkit.

Môn học trong trường KHTN TP.HCM là : Xử lý tiếng nói (Thầy Vũ Hải Quân) - xử lý ngôn ngữ tự nhiên (Thầy Đinh Điền) - xử lý số tín hiệu.

Cuối cùng là niềm đam mê.

[1] Davies , K.H., Biddulph, R. and Balashek, S. (1952) Automatic Speech Recognition of Spoken Digits, J. Acoust. Soc. Am. 24(6) pp.637 - 642

Tập phụ thuộc hàm được Bao trong quan hệ Qi

Ta có lược đồ Quan hệ Q0 và tập phụ thuộc hàm F.
Lược đồ Quan hệ được chia ra nhiều lược đồ con Qi, vấn đề là xác định các phụ thuộc hàm cho các quan hệ Qi đó.

Fi = {f thuộc F+ /VT(f) U VP(f) thuộc Qi}

Chi tiết cách xác định là:

+ Xác định vế trái (VT) của phụ thuộc hàm Fi : Chọn tất cả PTH có vế trái nằm trong Qi đang xét, gọi là X.
+ Xác định vế Phải (VP) của phụ thuộc hàm Fi : đối với từng PTH đã xác định được ở trên, ta tìm Bao đóng (VT)+, sau đó giao với tập thuộc tính Qi khi đó ta có X->Y là PTH được bao trong quan hệ Qi.

Nói dài dòng quá có ví dụ sẽ dễ hiểu hơn nhiều.

Ví dụ 1: Trích trong đề thi của Cô Đồng Thị Bích Thủy.
Cho lược đồ quan hệ Q(ABCEGHKLTVXYZ)
F ={EK->XC, C->V, EKL->TC, AB->YC, HG->ZABEKLC}

<Q1(KE XC) F1>
<Q2(AB CY) F2>
<Q3(HG EKLZAB) F3>
<Q4(C V) F4>
<Q5(EKL T) F5>

Xác định F1, F2, F3, F4, F5 là tập được bao trong từng quan hệ Qi trên.(i=1,2,3,4,5) ?

1. Xác định F1 với Q1(KE XC)
+ xác định các phụ thuộc hàm trong F có vế trái là thuộc tính trong Q1 : KE->XC
+ Tính (KE)+ = KEXCV Giao với KEXC = KEXC là các thuộc tính chung nằm trong cả hai vế.
+ vậy ta có PTH F1= {KE->XC}

2. Xác định F2 với Q2(AB CY)
+ xác định các phụ thuộc hàm trong F có vế trái là thuộc tính trong Q2: AB->CY, C->V
+ Tính (AB)+ = ABCYV giao với Q2(ABCY). cho các thuộc tính giống nhau trong (AB)+ và Q2, ta có AB->CY
+ Tính (C)+ = CV giao với Q2(ABCY) = C : loại
+ vậy F2 = {AB->CY}

Các câu còn lại tính giống như trên.




Dạng chuẩn BCK - BOYCE - CODD - KENT

Quan hệ R ở dạng chuẩn BCK khi tất cả các phụ thuộc hàm X →A trong R
đều phải có X là khoá của R.

Ví dụ: Quan hệ sau ở dạng 3NF nhưng không phải BCK.





Để nhận được quan hệ ở BCK, ta có thể tách quan hệ trên:
Cách 1: R1(Student, Instructor) và R2(Student, Course)
Cách 2: R1(Couse, Instructor} và R2(Course, Student)
Cách 3: R1(Instructor, Course} và R2(Instructor, Student)
Lưu ý: Việc tách quan hệ như trên sẽ làm mất đi phụ thuộc hàm FD1.

Câu hỏi thảo luận:
cho quan hệ R(ABCDEF) có khóa là AB và CD và tập F = {AB->CDEF,CD->ABEF}
Quan hệ trên đạt dạng chuẩn BCK không?


(Trích trong sách cơ sở dữ liệu của GV Phạm Thị Hoàng Nhung)

Dạng chuẩn 3 - DC3 - NF 3 - Third Normal Form

Quan hệ đạt dạng chuẩn 3 nếu:
+ Quan hệ đạt dạng chuẩn 2
+ Và không chứa phụ thuộc hàm phụ thuộc bắc cầu vào khóa.
+ Phụ thuộc hàm bắc cầu:


Mô tả dạng chuẩn 3:



Ví dụ 1: Quan hệ EMP_DEPT không đạt dạng chuẩn 3 vì tồn tại phụ thuộc hàm DNUMBER->DNAME,DMRGSSN là phụ thuộc hàm bắc cầu vào khóa.



Tách quan hệ trên thành hai quan hệ con EMPLOYEE và DEPARTMENT đề đạt dạng chuẩn 3.



Nhận xét: Một lược đồ quan hệ tốt nên đưa các quan hệ về dạng chuẩn 3. tuy nhiên vẫn có khả năng trùng lắp thông tin khi có PTH thuộc tính không khóa xác định thuộc tính khóa. VD: R(ABCD) F={AB->CD, C->B}



(Trích trong sách cơ sở dữ liệu của GV Phạm Thị Hoàng Nhung và bài giảng của Cô Đồng Thị Bích Thủy.)

Dạng chuẩn 2 - DC2 - NF 2

Một quan hệ đạt dạng chuẩn 2 nếu:
+ Quan hệ đó phải ở dạng chuẩn 1
+ Tất cả các thuộc tính không phải là khóa của quan hệ phải phụ thuộc đầy đủ vào khóa của quan hệ.
+ Phụ thuộc đầy đủ là: Phụ thuộc hàm Y->Z là phụ thuộc hàm đầy đủ nếu:

Mô tả dạng chuẩn 2:


Ví dụ 1: Quan hệ EMP_PROJ không đạt dạng chuẩn 2 vì tồn tại 2 phụ thuộc hàm FD2, FD3 là phụ thuộc hàm không đầy đủ.


Ví dụ 2: Quan hệ sau đạt dạng chuẩn 2 - NF2


Đạt dạng chuẩn 2 vẫn còn trùng lắp thông tin. Phụ thuộc hàm gây trùng lắp thông tin là DNUMBER->DNAME,DMGSSN, thuộc tính trùng lắp thông tin là DNUMBER, DNAME, DMGSSN



Ví dụ 3: Quan hệ sau cũng đạt dạng chuẩn 2 - NF2



Câu hỏi thảo luận:
Cho lược đồ quan hệ R(ABCDE) có AB là khóa của quan hệ và tập phụ thuộc hàm là F={AB->CDE, BC->DE}
Lược đồ trên có đạt dạng chuẩn 2 không?

(Trích trong sách cơ sở dữ liệu của GV Phạm Thị Hoàng Nhung.)

Dạng chuẩn 1 - DC1 - NF 1

Một lược đồ quan hệ R đạt dạng chuẩn 1 nếu tất cả các miền giá trị của các thuộc tính đều chứa giá trị nguyên tố. ví dụ : Thuộc tính Màu sắc không thể vừa là màu xanh vừa là màu đỏ mà phải nằm ở hai dòng khác nhau.


STT | Màu sắc
1 | Vàng, đỏ
=> Không đạt dạng chuẩn 1

STT | Màu sắc
1 | Vàng
2 |đỏ
=> Đạt dạng chuẩn 1

Ví dụ sau thể hiện quan hệ không đạt và đạt dạng chuẩn 1

Tập huấn văn hóa Doanh nghiệp và kỹ năng thuyết trình 12-16/5/2010

,

Tham gia xong lớp tập huấn kiến thức đọng lại thì ít nhưng tình cảm giao lưu giữa các bạn thì vô số kể, tất cả VNPT tại miền nam đều có mặt. Lê Quốc Toàn ơi có chuyến đi thật thú vị.











Tham dự Đại hội thanh niên làm theo lời Bác 16.5.2010

,

Hôm nay diễn ra đại hội thanh niên tiên tiến làm theo lời Bác năm 2010, với nhiều nội dung thiết thực như tặng quà cho các Em nhỏ huyện Bình Chánh, thăm Bà mẹ Việt Nam Anh Hùng, giao lưu với các Bạn Đoàn Viên TN tại quận Tân phú, ngày hội làm theo lời Bác lần III...
Hãy sống vì cuộc sống tốt đẹp.











February 2012
M T W T F S S
January 2012March 2012
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29