top 64 informatica interview questions with answers
最もよくあるInformaticaインタビューの質問と回答:
この記事では、Informatica MDM、PowerCenter、データ品質、クラウド、ETL、管理者、テスト、および開発者に関する質問について説明します。
今日のシナリオでは、INFORMATICAは世界中で最も要求の厳しい製品のタグを達成しました。新たに発売された商品ですが、短期間で人気を博しました。
長年にわたり、INFORMATICAはテクノロジー分野であるデータ統合のリーダーとして活動してきました。 ETL(Extract、Transfer、Load)アーキテクチャに基づくこのデータ統合ツールには、政府機関、金融および保険会社、ヘルスケア、およびその他のいくつかのビジネスにサービスを提供することに焦点を当てたいくつかの製品があります。
さて、これはINFORMATICAの背景にすぎませんでした。しかし今日、データウェアハウジング分野は驚異的な成長を遂げており、業界では多くの雇用機会が利用可能です。
最高のInformaticaインタビューの質問と回答
以下に、最もよく聞かれる面接の質問と回答のリストを示します。約64の質問が含まれているため、Informaticaの概念に関する知識をより簡単に磨くことができます。
Q#1)INFORMATICAとは何ですか?なぜそれが必要なのですか?
回答: INFORMATICAは、ETL、データ仮想化、マスターデータ管理、データ品質、データレプリカ、ウルトラメッセージングなどのデータ統合ソリューションを提供するソフトウェア開発会社です。
人気のあるINFORMATICA製品のいくつかは次のとおりです。
- IT PowerCenter
- INFORMATICA PowerConnect
- コンピューティングパワーマート
- INFORMATICA Power Exchange
- INFORMATICAパワー分析
- INFORMATICAの電力品質
一連のルールとともに特定の操作を実行するためのデータを含むデータシステムを操作する場合は、INFORMATICAが必要です。構造化データシステムと非構造化データシステムからのデータの運用ラインのクリーニングと変更を容易にします。
Q#2)リポジトリ内のINFORMATICAオブジェクトの形式は何ですか? Windowsに接続できるデータベースは何ですか?
回答: INFORMATICAオブジェクトはXML形式で記述できます。
以下は、接続できるデータベースのリストです。
- SQLサーバー
- オラクル
- MSAccess
- MSExcel
- DB2
- Sybase
- Teradata
Q#3)INFORMATICA PowerCenterとは何ですか?
回答: これは、さまざまなソースおよびデータ処理からデータを接続および取得するために使用されるETL /データ統合ツールです。 PowerCenterは大量のデータを処理し、SAP、PeopleSoftなどのERPソースからのデータ取得をサポートします。
PowerCenterをSQLやOracleなどのデータベース管理システムに接続して、データを3番目のシステムに統合できます。
Q#4)使用可能なINFORMATICA PowerCenterの異なるエディションはどれですか?
回答:INFORMATICAPowerCenterのさまざまなエディションは次のとおりです。
- 標準版
- Advanced Edition
- プレミアムエディション
利用可能なPowerCenterの現在のバージョンはv10であり、パフォーマンスが向上しています。
Q#5)PowerCenterとPower Mapをどのように区別できますか?
回答:以下は、PowerCenterとPowerMapの違いです。
IT PowerCenter | コンピュータサイエンスPowerMart | ||
---|---|---|---|
5858 | 4566 | 3550 | 2016年1月23日 |
1.1。 | 大量のデータを処理します | 少量のデータを処理します | |
二。 | グローバルおよびローカルリポジトリをサポート | ローカルリポジトリのみをサポート | |
3.3。 | ERPからのデータ取得をサポートします SAP、PeopleSoftなどのソース。 | ERPソースからのデータ取得をサポートしていません | |
四。 | ローカルリポジトリをグローバルに変換します | ローカルリポジトリをグローバルに変換しないでください |
Q#6)PowerCenterのさまざまなコンポーネントは何ですか?
回答:PowerCenterの7つの重要なコンポーネントを以下に示します。
- PowerCenterサービス
- PowerCenterクライアント
- PowerCenterリポジトリ
- PowerCenterドメイン
- リポジトリサービス
- 統合サービス
- PowerCenter管理コンソール
- Webサービスハブ
Q#7)PowerCenterのさまざまなクライアントは何ですか?
回答:PowerCenterクライアントのリストは次のとおりです。
- PowerCenterデザイナー
- PowerCenterワークフローモニター
- PowerCenterワークフローマネージャー
- PowerCenterリポジトリマネージャー
Q#8)INFORMATICA PowerCenterリポジトリとは何ですか?
回答: PowerCenterリポジトリは、次のようなメタデータを含むリレーショナルデータベースまたはシステムデータベースです。
- ソース定義
- ターゲット定義
- セッションとセッションログ
- ワークフロー
- ODBC接続
- マッピング
リポジトリには次の2つのタイプがあります。
- グローバルリポジトリ
- ローカルリポジトリ
メタデータに基づいて抽出、変換、および読み込み(ETL)を実行するには、PowerCenterリポジトリが必要です。
Q#9)トレースレベルを詳しく説明する方法は?
回答: トレースレベルは、サーバーがログファイルに書き込む情報の量として定義できます。トレースレベルは、変換レベルまたはセッションレベル、あるいは両方のレベルで作成および構成されます。
以下に、4種類のトレースレベルを示します。
- なし
- 簡潔
- 詳細な初期化
- 詳細データ
Q#10)PowerCenter統合サービスを詳しく説明する方法は?
回答: 統合サービスは、PowerCenterプロセスのワークフローと実行を制御します。
次の図に示すように、INFORMATICA統合サービスには3つのコンポーネントがあります。
統合サービスプロセス: これはpmserverと呼ばれ、統合サービスはワークフローを監視するために複数のプロセスを開始できます。
負荷分散: 負荷分散とは、ワークロード全体をグリッド内の複数のノードに分散することです。ロードバランサーは、コマンド、セッションなどを含むさまざまなタスクを実行します。
データ変換マネージャー(DTM): Data Transformation Managerを使用すると、次のデータ変換を実行できます。
- アクティブ: 出力の行数を変更します。
- 受動的: 出力の行数は変更できません。
- 接続済み: 他の変換へのリンク。
- 未接続: 他の変換へのリンクはありません。
Q#11) PowerCenter on Gridとは何ですか?
回答: INFORMATICAには、パフォーマンスを向上させるために最大のデータスケーラビリティに利用できるグリッドコンピューティングの機能があります。グリッド機能は、負荷分散と並列処理に使用されます。
PowerCenterドメインには、ワークロードを構成してグリッド上で実行するための複数のノードのセットが含まれています。
に ドメイン PowerCenterが提供する効率的なサービス管理の基盤です。
ノード PowerCenter環境を実行するために論理的に表される独立した物理マシンです。
Q#12)エンタープライズデータウェアハウジングとは何ですか?
回答: 大量のデータが単一のアクセスポイントでアセンブルされる場合、それはエンタープライズデータウェアハウスと呼ばれます。このデータは、定期的に、または時間要件の必要に応じて、再利用および分析できます。
中央データベースまたは単一のアクセスポイントと見なされるエンタープライズデータウェアハウジングは、完全なグローバルビューを提供するため、意思決定支援に役立ちます。
その機能を定義する次の点から、より理解することができます。
- この統合データベースに保存されているすべての重要なビジネス情報には、組織全体のどこからでもアクセスできます。
- 必要な時間は長くなりますが、この単一のソースを定期的に分析すると、常により良い結果が得られます。
- データを組織全体でアクセスできるようにしながら、データのセキュリティと整合性が損なわれることはありません。
Q#13)セッションパーティショニングの利点は何ですか?
回答: 統合サービスが環境で実行されている間、ワークフローはパフォーマンスを向上させるために分割されます。これらのパーティションは、抽出、変換、および読み込みを実行するために使用されます。
Q#14) ロードプロセスの完了後にインデックスを作成するにはどうすればよいですか?
回答: コマンドタスクは、インデックスを作成するために使用されます。コマンドタスクスクリプトをワークフローのセッションで使用して、インデックスを作成できます。
Q#15)セッションとは何ですか?
回答: セッションは、データをソースから宛先に移動するときに使用される一連の命令です。セッションを分割して、いくつかのセッションシーケンスを実装し、サーバーのパフォーマンスを向上させることができます。
セッションを作成した後、サーバーマネージャーまたはコマンドラインプログラムを使用できます pmcmd セッションを停止または開始します。
Q#16)バッチはどのように使用できますか?
回答: バッチは、サーバー上のソースからターゲットにデータを移行するために使用されるセッションのコレクションです。バッチには最大数のセッションを含めることができますが、ネットワークトラフィックが増えるのに対し、バッチ内のより少ないセッションを迅速に移動できます。
Q#17)マッピングとは何ですか?
回答: マッピングは、式変換、ソーター変換、アグリゲーター変換、ルーター変換などの特定の変換セットを介して相互にリンクされているソースとターゲットのコレクションです。
Q#18)トランスフォーメーションとは何ですか?
回答: 変換は、宛先でのデータフローとデータロードを定義するために適用される一連のルールと命令として定義できます。
Q#19)式変換とは何ですか?
回答: これは、一度に1つのレコードのデータを変換するために使用されるマッピング変換です。式の変換は、パッシブまたは接続することができます。この式は、条件ステートメントを使用したデータ操作と出力生成に使用されます。
Q#20)更新戦略の変革とは何ですか?
回答: Informaticaの更新戦略は、Informaticaを通過するデータを制御し、INSERT、UPDATE、DELETE、REJECTなどのタグを付けるために使用されます。更新戦略トランスフォーメーション内に条件付きロジックを設定して、タグを付けることができます。
Q#21)ソーター変換とは何ですか?
javaはオブジェクトの配列を作成します
回答: ソーター変換は、複数のポートを介して大量のデータをソートするために使用されます。 SQLではORDERBY句として機能する可能性が非常に高くなります。ソーター変換は、アクティブ、パッシブ、または接続にすることができます。
アクティブ変換はマッピングを通過して行数を変更しますが、パッシブ変換はマッピングを通過しますが行数は変更しません。
ほとんどのINFORMATICAトランスフォーメーションは、データパスに接続されています。
Q#22)ルーター変換とは何ですか?
回答: ルーター変換は、ソースデータをフィルタリングするために使用されます。ルーター変換を使用して、単一のデータソースを分割できます。
これはフィルター変換によく似ていますが、唯一の違いは、フィルター変換は1つの変換条件のみを使用し、条件を満たさない行を返すのに対し、ルーター変換は複数の変換条件を使用し、単一の条件にも一致する行を返すことです。
Q#23)ランク変換とは何ですか?
回答: ランク変換はアクティブであると同時に接続されています。これは、レコードのセットを上位または下位に並べ替えてランク付けするために使用されます。また、特定のポートに基づいて最大または最小の数値を持つデータを選択するためにも使用されます。
Q#24)ランク変換におけるランクインデックスとは何ですか?
回答: ランクインデックスは、タスク設計者によって各レコードに割り当てられます。ランクインデックスポートは、各行のランキング位置を格納するために使用されます。ランク変換は、各行を上から下に識別し、ランクインデックスを割り当てます。
Q#25)INFORMATICAのステータスコードとは何ですか?
回答: コードは、各セッション中にエラー処理メカニズムを提供します。ステータスコードは、ストアドプロシージャによって発行され、正常にコミットされたかどうかを認識し、セッションを停止するか続行するかを決定するための情報をINFORMATICAサーバーに提供します。
Q#26)ジャンク寸法とは何ですか?
回答: ジャンクディメンションは、ランダムコードやフラグなどのジャンク属性のグループで構成される構造です。これは、同じディメンションに対して複数のテーブルを作成するのではなく、特定のディメンションに関する関連コードを1か所に格納するためのフレームワークを形成します。
Q#27)InformaticaのMappletとは何ですか?
回答: Mappletは、複数のマッピングで使用できる変換および変換ロジックの特定のルールセットを含む再利用可能なオブジェクトです。マップレットは、デザイナーツールのマップレットデザイナーで作成されます。
Q#28) Informaticaのデコードとは何ですか?
回答: Decodeを理解するために、SQLのCASEステートメントに似ていると考えてみましょう。これは基本的に、レコード内の特定の値を検索するために式変換によって使用される関数です。
結果値を返すためにポートが指定されているDecode関数内では、無制限の検索が可能です。この関数は通常、ネストされたIFステートメントを置き換える必要がある場合、または定数値を持つ小さなテーブルを検索してルックアップ値を置き換える必要がある場合に使用されます。
デコードは、式変換内で使用される関数です。これは、SQLのCASEステートメントと同じように、特定のレコードを検索するために使用されます。
以下は、SQLのCASEの簡単な例です。
構文:
SELECT EMPLOYEE_ID, CASE WHEN EMPLOYEE_AGE <= 20 THEN 'Young' WHEN EMPLOYEE_AGE> 30 AND AGE <= 40 THEN 'Knowledgeable' WHEN EMPLOYEE_AGE> 40 AND AGE = 60 THEN ‘Wise’ ELSE ‘Very Wise’ END AS EMPLOYEE_WISDOM FROM EMPLOYEE
Q#29)INFORMATICAのジョイナトランスフォーメーションとは何ですか?
回答: ジョイナトランスフォーメーションの助けを借りて、INFORMATICAのジョインを利用できます。
つまり、次の2つのソースに基づいています。
- マスターソース
- 詳細ソース
次の結合は、SQLの場合と同様にJoiner変換を使用して作成できます。
- 通常の結合
- 完全外部結合
- マスター外部結合(右外部結合)
- 詳細外部結合(左外部結合)
Q#30)INFORMATICAのアグリゲーター変換とは何ですか?
回答: アグリゲータートランスフォーメーションはアクティブまたは接続できます。これは、SQLではGROUPBY句として機能します。 INFORMATICAPowerCenterでグループの集計計算を実行すると便利です。集計タイプ関数vizを使用してデータの集計計算を実行します。 SUM、AVG、MAX、およびMIN。
Q#31)INFORMATICAのシーケンスジェネレータ変換とは何ですか?
回答: シーケンスジェネレータ変換は、パッシブまたは接続することができます。その基本的な使用法は、NEXTVALとCURRVALを使用して整数値を生成することです。
Q#32)INFORMATICAのユニオントランスフォーメーションとは何ですか?
回答: ユニオン変換は、異なるソースからのデータを結合し、同じポートとデータ型でフレーム化するために使用されます。これはSQLの句によく似ています。
Q#33)INFORMATICAのソース修飾子変換とは何ですか?
回答: ソース修飾子トランスフォーメーションはマッピングに役立ちます。リレーショナルフラットファイルを追加すると、自動的に作成されます。これは、統合サービスによって読み取られる行を表す、アクティブで接続された変換です。
Q#34)INFORMATICAワークレットとは何ですか?
回答: Workletは、再利用性の機能を備えたMappletとして機能します。唯一の違いは、Mappletとは異なり、WorkletをINFORMATICAの任意の数のワークフローに適用できることです。 Workletは、ロジックとタスクを1か所に保存して再利用します。
WorkletはMappletによく似ており、ワークフローレベルで再利用可能または再利用不可能なタスクのグループとして定義されます。必要な数のワークフローに追加できます。再利用性機能により、再利用可能なロジックを一度開発して、そこから再利用できるため、多くの時間を節約できます。
INFORMATICA PowerCenter環境では、マップレットが最も有利な機能と見なされています。これらはマップレットデザイナーで作成され、デザイナーツールの一部です。
基本的に、複数のマッピングで再利用されるように設計された一連の変換が含まれています。
マップレットは、次の方法でマッピングを簡素化する再利用可能なオブジェクトであると言われています。
- 複数の変換とソース定義を含みます。
- すべての入力ポートと出力ポートに接続する必要はありません。
- ソースからデータを受け入れ、複数の変換に渡します
全体として、マッピングロジックを再利用する必要がある場合は、ロジックをマップレットに配置する必要があります。
Q#35)INFORMATICAのSUBSTRとは何ですか?
回答: SUBSTRは、より大きな文字セットから文字セットを抽出または削除する関数です。
構文: SUBSTR(文字列、開始(、長さ))
どこ、
ストリング 検索する文字を定義します。
開始 カウントを開始する位置を設定するために使用される整数です。
長さ 開始位置から戻る文字列の長さをカウントするために使用されるオプションのパラメータです。
例えば、 SUBSTR(Contact、5、8)、ここでは、連絡先の5番目の文字から開始し、次の8文字に戻ります。
Q#36)コードページの互換性とは何ですか?
回答: データがソースコードページからターゲットコードページに転送される場合、データの損失を防ぐために、ソースページのすべての特性がターゲットページに存在する必要があります。この機能はコードページ互換性と呼ばれます。
INFORMATICAサーバーがUnicodeデータ移動モードで実行されている場合、コードページの互換性が明らかになります。この場合、2つのコードページは、エンコードされた文字が実質的に同一である場合に同一であると言われ、データの損失は発生しません。
完全に正確にするために、ソースコードページはターゲットコードページのサブセットであると言われています。
Q#37)接続されたルックアップと接続されていないルックアップをどのように区別できますか?
回答: Connected Lookupは、別のトランスフォーメーションに接続されているデータフローの一部であり、ルックアップを実行する別のトランスフォーメーションから直接データ入力を受け取ります。静的キャッシュと動的キャッシュの両方を使用します。
接続されていないルックアップは、別の変換からデータ入力を取得しませんが、LKP(LookUp)式を使用する任意の変換で関数として使用できます。静的キャッシュのみを使用します。
Q#38)インクリメンタルアグリゲーションとは何ですか?
回答: 増分集計は、セッションが作成されるとすぐに生成されます。これは、大幅な変更でターゲットデータを変更しないソースデータの変更を計算するために使用されます。
CUSTOMER_NO | BILL_NO | 量 | 日付 |
---|---|---|---|
1001 | 4001 | 1000 | 2016年1月11日 |
2001年 | 4002 | 2550 | 2016年1月11日 |
3001 | 5012 | 4520 | 2016年1月11日 |
1001 | 6024 | 2000年 | 2016年1月23日 |
1001 | 6538 | 5240 | 2016年1月23日 |
2001年 | 7485 | 5847 | 2016年1月23日 |
1515 | 4572 | 6000 | 2016年1月23日 |
最初のロードでの出力は次のとおりです。
CUSTOMER_NO | BILL_NO | LOAD_KEY | 量 |
---|---|---|---|
1001 | 4001 | 20011 | 1000 |
2001年 | 4002 | 20011 | 2550 |
3001 | 5012 | 20011 | 4520 |
これで、2回目のロード時に、次のセッション日付でデータが集約されます。
CUSTOMER_NO | BILL_NO | LOAD_KEY | 量 | 備考/操作 |
---|---|---|---|---|
1001 | 6538 | 20011 | 8240 | キャッシュファイルは集約後に更新されます |
2001年 | 7485 | 20011 | 8397 | キャッシュファイルは集約後に更新されます |
3001 | 5012 | 20011 | 4520 | 変化なし |
5858 | 4566 | 20011 | 3550 | 変化なし |
1515 | 4572 | 20011 | 6000 | 変化なし |
Q#39)サロゲートキーとは何ですか?
回答: サロゲートキーは、テーブル内の各行の一意の識別として必要な主キーの別の代替または置換として使用される、順次生成される整数値です。
主キーは必要に応じて頻繁に変更される可能性があるため、将来の要件に対して更新プロセスがより困難になります。この問題の唯一の解決策は代理キーです。
Q#40)セッションタスクとコマンドタスクとは何ですか?
回答: セッションタスクは、セッションコマンドを使用してソースからターゲットにデータを転送するときに適用される一連の命令です。セッションコマンドは、セッション前コマンドまたはセッション後コマンドのいずれかです。
コマンドタスクは、ワークフロー中にUNIXの1つまたは複数のシェルコマンドをWindowsで実行できるようにする特定のタスクです。
Q#41)スタンドアロンコマンドタスクとは何ですか?
回答: スタンドアロンコマンドタスクを使用して、ワークフロー内のいつでもどこでもシェルコマンドを実行できます。
Q#42) ワークフローとは何ですか?ワークフローマネージャーのコンポーネントは何ですか?
回答: ワークフローは、タスクを実装する方法です。これは、タスクの実装方法についてサーバーに通知する命令のコレクションです。
以下に、ワークフローマネージャーの3つの主要コンポーネントを示します。
- タスクデザイナー
- タスク開発者
- ワークフローデザイナー
Q#43)イベントとは何ですか?それに関連するタスクは何ですか?
回答: イベントは、ワークフローで発生する任意のアクションまたは関数にすることができます。
これに関連する2つのタスクがあります。
- イベント待機タスク: このタスクは、イベントが発生するまで待機します。イベントがトリガーされると、このタスクは完了し、次のタスクを割り当てます。
- イベント発生タスク: イベント発生タスクは、ワークフロー内の特定のイベントをトリガーします。
Q#44) 事前定義されたイベントおよびユーザー定義のイベントとは何ですか?
回答: 事前定義されたイベントは、特定のファイルが特定の場所に到着するまで待機するシステム定義のイベントです。 File-Watcherイベントとも呼ばれます。
ユーザー定義のイベントは、作成されたワークフローでいつでも発生するようにユーザーによって作成されます。
Q#45)TargetDesignerとTargetLoad Orderとは何ですか?
回答: Target Designerは、データのターゲットを定義するために使用されます。
INFORMATICAサーバーを介して複数のソースまたは複数のパーティションが異なるターゲットにリンクされた単一のソースがある場合、サーバーはターゲットのロード順序を使用して、データがターゲットにロードされる順序を定義します。
Q#46)ステージングエリアとは何ですか?
回答: ステージング領域は、作業領域に接続された一時テーブルが格納されるデータベース、またはデータ処理の入力を提供するファクトテーブルです。
Q#47)STOPとABORTの違いは何ですか?
回答:違いは次のとおりです。
- やめる コマンドはセッションタスクで実行されます。コマンドが発生すると、統合サービスはデータソース内のデータの読み取りのみを停止し、処理とターゲットへの書き込みを続行します。
- 中絶 コマンドは、統合サービスによるターゲットへのデータの読み取り、処理、および書き込みを完全に停止するために使用されます。統合サービスを介したデータの処理と書き込みを完了するための60秒の独自のタイムアウト期間があります。そうでない場合は、単にセッションを強制終了します。
Q#48)異なるルックアップキャッシュは何ですか?
回答: ルックアップは、キャッシュまたはキャッシュ解除できます。基本的には5つの部分に分かれています。
彼らです:
- 静的キャッシュ
- 動的キャッシュ
- 再キャッシュ
- 永続キャッシュ
- 共有キャッシュ
静的キャッシュは、セッションの実行中は変更されずにそのまま残ります。
ダイナミックキャッシュは、セッションの実行中に頻繁に更新され続けます。
Q#49)ソース定義を更新するにはどうすればよいですか?
回答: ソース定義を更新する方法は2つあります。
彼らです:
- 既存のソース定義を編集できます。
- データベースから新しいソースをインポートできます。
Q#50)リポジトリマネージャを使用してセキュリティ対策を実装するにはどうすればよいですか?
回答: セキュリティ対策を実施する方法は3つあります。
彼らです:
- 所有者、グループ、およびユーザー内のフォルダーのアクセス許可。
- ロック(読み取り、書き込み、取得、保存、実行)。
- リポジトリ特権すなわち。
- リポジトリを参照します。
- ワークフローマネージャーを使用します(セッションとバッチを作成し、そのプロパティを設定します)。
- ワークフローオペレーター(セッションとバッチを実行するため)。
- Designer、管理リポジトリを使用します(すべてのユーザーがリポジトリを作成および管理できるようにします)。
- 管理者ユーザー(ユーザーがリポジトリサーバーを作成し、そのプロパティを設定できるようにします)。
- SuperUser(すべての特権がユーザーに付与されます)。
Q#51)INFORMATICAの利点を活用してください。
回答: 最も好まれるデータ統合ツールと見なされているため、参加する必要のある利点は複数あります。
彼らです:
- メインフレーム、RDBMSなどの異なるデータソース間でデータを効果的かつ非常に効率的に通信および変換できます。
- 通常、他の利用可能なプラットフォームよりも非常に高速で、堅牢で、簡単に学習できます。
- INFORMATICAワークフローモニターを使用すると、ジョブを簡単に監視したり、失敗したジョブを回復したり、実行速度の遅いジョブを指摘したりできます。
- データベース情報の簡単な処理、データ検証、あるデータベースから別のデータベースへのプロジェクトの移行、プロジェクト開発、反復などの機能があります。
Q#52)INFORMATICAが必要ないくつかの領域またはリアルタイムの状況を参加させます。
回答: あるプラットフォームから他のプラットフォームへのデータウェアハウジング、データ統合、データ移行、およびアプリケーション移行は、リアルタイムの使用領域のいくつかの例です。
Q#53)ETLプログラムについていくつかの例を挙げて説明してください。
回答: その独自性で知られるETLツールは、抽出、変換、読み込みツールの略で、基本的にデータを抽出し、データを変更することで定義された場所に送信するという目的を解決します。
非常に正確に言うと:
- 抽出タスクは、データベースやファイルなどのソースからデータを収集することです。
- 変換は、ソースから受信したデータを変更すると見なされます。
- ロードは、変更されたデータを定義されたターゲットにフィードするプロセスを定義します。
技術的な方法で理解するために、ETLツールは異種ソースからデータを収集し、定義されたタスクの分析にさらに使用できるようにデータを同種に変更します。
いくつかの基本的なプログラムの例は次のとおりです。
- マッピングは、マッピングプロセスがデザイナーで行われる元のソースからデータを読み取るETLプロセスを導き出します。
- ワークフローは、ワークフローマネージャーウィンドウで決定および設計された複数のタスクで構成されます。
- タスクは、実行時に実行されるアクションのシーケンスを決定する一連の複数のステップで構成されます。
Q#54)データベースとデータウェアハウスの違いを登録してください。
回答: 2つの違いを理解するには、以下の表を参照してください。
1〜10 c ++の乱数
データベース | データウェアハウス |
---|---|
日常業務で使用される最新の状態を保存/記録します | 情報支援に長期的に利用される履歴データを保存・分析します。 |
その方向性は、単純なトランザクションと短いトランザクションを含むオンライントランザクション処理です。 | その方向性は、複雑なクエリを含むオンライン分析処理です。 |
これは、詳細でプリミティブなデータで構成されており、ビューはフラットなリレーショナルです。 | これは、ビューが多次元である統合データの要約で構成されています。 |
分析クエリではパフォーマンスが低下します。 | ここでは、分析クエリは高性能と判断されます。 |
効率は、トランザクションのスループットを測定することによって決定されます。 | 効率は、クエリのスループットと応答時間を測定することによって決定されます。 |
Q#55)接続ルックアップと非接続ルックアップの機能について説明してください。
回答:ConnectedLookupの機能は次のように説明できます。
- 接続されたルックアップ用のパイプラインからの直接入力ソースがあります。
- データフローに積極的に参加し、動的キャッシュと静的キャッシュの両方がそのまま使用されます。
- すべてのルックアップ列をキャッシュし、ルックアップ条件が一致しない場合はデフォルト値を出力として返します。
- 複数の列値を出力ポートに返すことができます。
- 複数の出力値が渡され、出力ポートが別の変換にリンクされます。
- 接続されたルックアップは、ユーザー定義のデフォルト値をサポートします。
接続されていないルックアップの機能は、次のように説明できます。
- 接続されていないルックアップは静的キャッシュを使用し、その入力のソースはLKP式の出力から受け取った結果です。
- ルックアップ出力ポートのみをキャッシュし、ルックアップ条件が一致しない場合は値をNULLとして返します。
- 各ポートから返される列は1つだけです。
- 1つの出力値のみが別の変換に渡されます。
- ユーザー定義のデフォルト値は、接続されていないルックアップではサポートされていません。
Q#56)実行中のセッション中に、出力ファイルがInformaticaサーバーによって作成されます。それらのいくつかを参加させます。
回答: 以下にいくつかの出力ファイルを示します。
- キャッシュファイル: これらのファイルは、メモリキャッシュの作成時に作成されます。ルックアップ変換、アグリゲーター変換などの状況では、インデックスとデータキャッシュファイルはInformaticaサーバーによって作成されます。
- セッション詳細ファイル: 名前が定義するように、このファイルには、テーブル名、マッピングでターゲットごとに拒否または書き込まれた行などの負荷統計が含まれ、モニターウィンドウで表示できます。
- パフォーマンス詳細ファイル: このファイルはセッションプロパティシートの一部であり、改善領域を決定するためのセッションパフォーマンス情報が含まれています。
- INFORMATICAサーバーログ: サーバーはすべてのステータスメッセージとエラーメッセージのログを作成し、ホームディレクトリに表示されます。
- セッションログファイル: サーバーは、セッションごとに、設定されたトレースレベルに応じてセッションログファイルを作成します。セッションに関するログファイルに表示される情報は次のとおりです。
- セッション初期化プロセス、
- リーダースレッドとライタースレッド用のSQLコマンドの作成、
- 発生したエラーのリストと
- 負荷の概要
- セッション後の電子メール: これは、セッションに関する情報(セッションの完了/セッションの失敗)を目的の受信者に自動的に伝達するのに役立ちます。
- ファイルを拒否します: このファイルには、ターゲットに使用/書き込みされていないデータに関する情報が含まれています。
- 制御ファイル: セッションが外部ローダーを使用する場合、制御ファイルは、ターゲットファイルに関するロード命令とデータ形式で構成されます。
- インジケーターファイル: このファイルには基本的に、INSERT / UPDATE / DELETEまたはREJECTのマークが付けられた行を強調表示する番号が含まれています。
- 出力ファイル: 出力ファイルは、ファイルのプロパティに基づいて作成されます。
Q#57)アクティブ変換とパッシブ変換を区別する方法は?
回答: アクティブ変換とパッシブ変換の違いを理解するために、違いをより適切に説明する機能を見てみましょう。
アクティブ変換によって実行されるアクションには、次のものがあります。
- 変換を通過する、要件に応じた行数の変更。 例えば、 条件を満たさない行を削除するフィルター変換。
- ロールバックポイントとコミットポイントを設定して、トランザクションの境界を変更します。 例えば、 トランザクション制御の変換。
- INSERT / UPDATE / DELETEまたはREJECTの行タイプを変更します。
パッシブ変換によって実行されるアクションには、次のものがあります。
- 変換を通過する行数は変更されません。
- トランザクション境界が設定されます。
- 行タイプが設定されます。
Q#58)さまざまなタイプの変換を参加させます。
回答:さまざまなタイプの変換は次のとおりです。
- アグリゲーター変換
- 式の変換
- ノーマライザ変換
- ランク変換
- フィルタ変換
- ジョイナー変換
- ルックアップ変換
- ストアドプロシージャの変換
- ソート変換
- 戦略の変革を更新する
- XMLソース修飾子の変換
- ルーター変換
- シーケンスジェネレータ変換
Q#59)ダイナミックキャッシュとは何ですか?
回答: INFORMATICAルックアップは、キャッシュまたは非キャッシュのいずれかに分類できます。動的キャッシュの場合、行の受け渡し時に行を挿入または削除でき、ターゲットと同期されます。キャッシュメモリは、セッション内の削除/更新操作の後に毎回更新されます。
Q#60)静的キャッシュでのデコードとは何ですか?
回答: 静的キャッシュは、セッションの実行時に更新も更新もされないキャッシュです。これはデフォルトのキャッシュであり、戻り条件がtrueの場合にのみ値を返します。それ以外の場合は、Null値を返します。この場合、キャッシュの挿入または更新は実行できません。
Q#61)フィルター変換に対するルーター変換の利点をいくつか挙げてください。
回答: ルーター変換とフィルター変換はどちらも条件を使用してデータをテストおよびフィルター処理するため、同じです。
ただし、フィルター変換に対するルーターの利点は、以下の点で理解できます。
ルーター変換:
- 複数のテスト条件が可能です。
- 複数の条件で同じ入力データをテストする機能を提供します。
- マッピングの場合、入力データはサーバーによって1回だけ処理されるため、パフォーマンスが向上します。
- それほど複雑ではなく、より効率的です。
- テスト条件に失敗したレコードはブロックされず、代わりにデフォルトグループに渡されます。
Q#62)セッションのいくつかのプロパティを参加させます。
回答: セッションはワークフローマネージャーで使用でき、セッションタスクを作成することで構成されます。マッピングプログラム内には、複数のセッションが存在する可能性があり、再利用可能または再利用不可能のいずれかになります。
セッションのプロパティの一部は次のとおりです。
- 要件に応じて、セッションタスクは同時に実行することも順次実行することもできます。
- パフォーマンスを分析するようにセッションを構成できます。
- セッションタスクを作成または実行するには、セッション名、スケジュール、および統合サービスに関する一般的な情報が必要です。
- セッションのその他の重要なプロパティには、セッションログファイル、テストロード、エラー処理、コミット間隔、ターゲットプロパティなどがあります。
Q#63)ソース修飾子変換が使用されるタスクを参加させます。
回答: ソース修飾子は、実行中のセッション内の統合サービスに関係する行を読み取るアクティブな変換と見なされます。これは、データがソースからフェッチされ、ソースをマッピングに追加するときに自動的に追加される方法を決定します。
ソース修飾子が使用されるさまざまなタスクのリストは次のとおりです。
- 行フィルタリング
- データの並べ替え
- カスタムクエリの作成
- 同じソースからのテーブルの結合
- 個別の値の選択
Q#64)基本的な目的を持つPower Centerクライアントアプリケーションをいくつか挙げてください。
回答: セッションとワークフローの作成、ワークフローの進行状況の監視、マップレットの設計などのタスクは、PowerCenterクライアントアプリケーションによって実行されます。
以下に、PowerCenterクライアントアプリケーションとその目的のリストを示します。
- リポジトリマネージャー: これは管理ツールであり、その基本的な目的は、リポジトリフォルダー、オブジェクト、グループなどを管理することです。
- 管理コンソール: ここでは、開始/停止、バックアップ/復元、アップグレード/削除などのサービスタスクが実行されます。
- パワーセンターデザイナー: デザイナーは、さまざまな目的に役立つさまざまなデザインツールで構成されています。 これらの設計ツールは次のとおりです。
- ソースアナライザー
- ターゲットデザイナー
- 変換開発者
- マップレットデザイナー
- マッピングマネージャー
- ワークフローマネージャー: その基本的な目的は、デザイナで設計されたマッピングを実行するために必要な一連の命令/ワークフローを定義することです。ワークフローの開発を支援するために、タスク開発者、ワークフローデザイナー、ワークレットデザイナーの3つのツールを利用できます。
- ワークフローモニター: 名前が示すように、ワークフローモニターは、ワークフローまたはタスクを監視します。 使用可能なウィンドウのリストは次のとおりです。
- ナビゲータウィンドウ
- 出力ウィンドウ
- 時間枠
- プロパティウィンドウ
- タスクビュー
- ガントチャートビュー
結論
ツールと面接で尋ねられる質問の種類について、これまでに明確なアイデアが得られていることを願っています。
INFORMATICAは、データ統合を実行するための最良のソリューションです。 Windows、Linux、Unixなどのマルチプラットフォーム環境でマルチデータ管理と連携し、50,000以上のプラットフォームでテストされ、他のいくつかの中でより良い結果と最高のパフォーマンスが得られます。
簡単に言うと、INFORMATICAは、さまざまなソースから情報またはデータを収集し、実際に保存せずにその情報を定義済みの特定のターゲットにロードするETLツールです。そのタスクは、さまざまなサービスとリソースをさまざまなマシンに提供することです。したがって、提供されるデータは正確であり、驚くべき結果が得られる必要があります。
この記事を通じてInformaticaの概念に関する知識を磨き、すぐに面接の準備をしてください。
ではごきげんよう!!!
推奨読書
- 面接の質問と回答
- ETLテストの面接の質問と回答
- いくつかのトリッキーな手動テストの質問と回答
- トップ32のベストデータステージインタビューの質問と回答
- トップTeradataインタビューの質問と回答
- SASインタビューの質問と回答トップ30
- 詳細な回答を含む上位24のデータモデリングインタビューの質問
- 完璧なデータ管理のための10の最高のデータ分析ツール(2021リスト)
- テストデータ管理用のIBMRational QualityManagerのデータプール機能
- テストデータ管理の概念、プロセス、および戦略
- 2021年のトップ14ベストテストデータ管理ツール