top 32 best datastage interview questions
今後の面接の準備に役立つ、最もよくあるデータステージ面接の質問と回答のリスト:
DataStageは、現在の市場で利用可能だった非常に人気のあるETLツールです。
この記事では、IBMDatastageのインタビューを対象とした非常に役立つ一連の質問と回答を共有しています。以下のDatastage面接の質問に答えると、面接を簡単に破ることができます。
Datastageの面接の質問に対する詳細な回答を取り上げました。これは、初心者や経験豊富な専門家に役立ちます。
推奨読書=> ETLテストの面接の質問
最も一般的なDatastageインタビューの質問と回答
はじめましょう!
Q#1)Datastageとは何ですか?
回答: Datastageは ETLツール によって与えられた IBM GUIを利用してデータ統合ソリューションを設計します。これは、並列処理の概念を提供した最初のETLツールでした。
次の3つの異なるエディションで利用可能です
- サーバーエディション
- Enterprise Edition
- MVSエディション
Q#2)Datastageの主な機能を強調しますか?
回答: Datastageの主な機能を以下に示します。
- これは、IBMInfosphere情報サーバーのデータ統合コンポーネントです。
- これはGUIベースのツールです。 Datastageオブジェクトをドラッグアンドドロップするだけで、Datastageコードに変換できます。
- ETL操作(抽出、変換、読み込み)を実行するために使用されます
- 複数のソースと複数のターゲットへの接続を同時に提供します
- これは、Datastageジョブが大量のデータを非常に高速に処理できるようにするパーティション分割および並列処理技術を提供します。
- エンタープライズレベルの接続性があります。
Q#3)Datastageツールの主な用途は何ですか?
回答: Datastageは、主にソースシステムからデータを抽出し、そのデータを変換して、最終的にターゲットシステムにロードするために使用されるETLツールです。
Q#4)DataStageの7.xバージョンと8.xバージョンの間で観察された主な違いは何ですか?
回答: ここに 両方のバージョンの主な違いは
7.x | 8.x |
---|---|
7.xバージョンはプラットフォームに依存していました | このバージョンはプラットフォームに依存しません |
データステージがUnixサーバー上に構築されている2層アーキテクチャを備えています | 下部にUNIXサーバーデータベースがあり、次にリポジトリとして機能するXMETAデータベースがあり、上部にデータステージがある3層アーキテクチャがあります。 |
パラメータセットの概念はありません | プロジェクトのどこでも使用できるパラメータセットがあります。 |
私たちは2つの別々のクライアントとしてデザイナーとマネージャーを持っていました | このバージョンでは、マネージャークライアントがデザイナークライアントに統合されました |
このバージョンの求人を手動で検索する必要がありました | ここでは、ジョブを簡単に検索できるリポジトリ内のクイック検索オプションがあります。 |
Q#5)IBM Infosphere情報サーバーの主な機能を強調できますか?
回答: IBMInfosphere情報サーバースイートの主な機能は次のとおりです。
ペネトレーションテストの方法
- データ統合のための単一のプラットフォームを提供します。複数のソースシステムに接続する機能と、複数のターゲットシステムに書き込む機能があります。
- これは、集中化されたレイヤーに基づいています。スイートのすべてのコンポーネントは、スイートのベースラインアーキテクチャを共有できます。
- 統合リポジトリ、統合メタデータサービス、および共通の並列エンジン用のレイヤーがあります。
- データの分析、クレンジング、監視、変換、配信のためのツールを提供します。
- 超並列処理機能を備えています。処理が非常に高速であることがわかります。
Q#6)情報サーバーアーキテクチャのさまざまなレイヤーは何ですか?
回答: 以下は、情報サーバーアーキテクチャのさまざまなレイヤーです。
- 統一されたユーザーインターフェイス
- 共通サービス
- 統合並列処理
- 統一されたメタデータ
- 共通の接続
Q#7)データソースシステムとは何でしょうか?
回答: データベーステーブル、フラットファイル、または人々のソフトのような外部アプリケーションでさえあり得ます。
Q#8)開発者として作業するインターフェースはどれですか?
回答: Datastage開発者として、ローカルシステムにインストールする必要があるDatastageデザイナと呼ばれるDatastageクライアントインターフェイスに取り組んでいます。バックエンドでは、Datastageサーバーに接続されています。
Q#9)Datastageのさまざまな一般的なサービスは何ですか?
回答: 以下は、Datastageの一般的なサービスのリストです。
- メタデータサービス
- 統合サービスの展開
- セキュリティサービス
- ループおよびレポートサービス。
Q#10)Datastageプロジェクトの開発をどのように始めますか?
回答: 最初のステップは、DatastageサーバーでDatastageジョブを作成することです。作成するすべてのDatastageオブジェクトは、Datastageプロジェクトに保存されます。 Datastageプロジェクトは、ジョブ、テーブル、定義、およびルーチンのためのサーバー上の独立した環境です。
Datastageプロジェクトは、ジョブ、テーブル、定義、およびルーチンのためのサーバー上の独立した環境です。
Q#11)DataStageジョブとは何ですか?
回答: Datastageジョブは、開発者として作成する単なるDataStageコードです。データとプロセスフローを定義するためにリンクされたさまざまなステージが含まれています。
ステージは、実装される機能に他なりません。
例えば: 売上高の合計を計算したいとします。これは、1つのステージで実行される「groupby」操作にすることができます。
次に、結果をターゲットファイルに書き込みます。したがって、この操作は別のステージで実行されます。両方のステージを定義したら、「groupby」ステージからターゲットファイルステージへのデータフローを定義する必要があります。このデータフローは、DataStageリンクによって定義されます。
両方のステージを定義したら、「groupby」ステージからターゲットファイルステージへのデータフローを定義する必要があります。このデータフローは、DataStageリンクによって定義されます。
Q#12)DataStageシーケンスとは何ですか?
回答: Datastageシーケンスは、DataStageジョブを論理フローで接続します。
Q#13)異なるジョブで同じコードを使用したい場合、これをどのように達成しますか?
回答: これは、共有コンテナーを使用して実行できます。再利用性のためにコンテナを共有しています。共有コンテナは、ステージとリンクで構成される再利用可能なジョブ要素です。さまざまなDatastageジョブで共有コンテナを呼び出すことができます。
Q#14)Datastageジョブはどこに保存されますか?
回答: Datastageジョブはリポジトリに保存されます。 Datastageジョブを保存できるさまざまなフォルダがあります。
Q#15)デザイナーのさまざまな段階はどこにありますか?
ヒープソートアルゴリズムc ++
回答: すべてのステージは、と呼ばれるウィンドウ内で利用できます ' パレット ' 。ステージが提供する機能の種類に応じて、さまざまなカテゴリがあります。
パレットのステージのさまざまなカテゴリは、一般、データ品質、データベース、開発、ファイル、処理などです。
Q#16)処理段階とは何ですか?
回答: 処理段階では、実際のデータ変換を適用できます。
例えば 、 ' Processingカテゴリのaggregatorステージでは、すべての「groupby」操作を適用できます。同様に、処理には、2つの異なる入力ストリームからのデータを結合できる「結合」段階などの他の段階があります。
Q#17)単純な基本的なDatastageジョブを作成するために必要な手順は何ですか?
回答: (ファイル)-> (新規)-> (並列ジョブ)を選択し、(OK)をクリックします。並列ジョブウィンドウが開きます。この並列ジョブでは、さまざまなステージをまとめて、それらの間のデータフローを定義できます。最も単純なDataStageジョブはETLジョブです。
ここでは、ソースシステムがデータベーステーブルまたはファイルのいずれかである可能性があるため、最初にファイルステージまたはデータベースステージのいずれかを使用できるソースシステムからデータを抽出する必要があります。
テキストファイルからデータを読み取っているとします。この場合、「SequentialFile」ステージを並列ジョブウィンドウにドラッグアンドドロップします。次に、このデータに加えて変換を実行する必要があります。処理カテゴリで利用できる「トランスフォーマー」ステージを使用します。 Transformerステージで任意のロジックを記述できます。
最後に、処理されたデータをいくつかのターゲットテーブルにロードする必要があります。私のターゲットデータベースがDB2だとしましょう。したがって、このために、DB2コネクターステージを選択します。次に、これらのデータ状態をシーケンシャルリンクを介して接続します。
この後 、 正しいファイルシステムまたはデータベースを指すようにステージを構成する必要があります。
例えば、 シーケンシャルファイルステージでは、ファイル名、ファイルの場所、列のメタデータなどの必須パラメーターを定義する必要があります。
次に、Datastageジョブをコンパイルする必要があります。ジョブをコンパイルすると、ジョブの構文がチェックされ、実行時に実行できるDatastageジョブの実行可能ファイルが作成されます。
Q#18)Datastageのさまざまな並べ替え方法に名前を付けます。
回答: 利用可能な2つの方法があります。
- リンクソート
- 組み込みのDatastageソート
Q#19)バッチでジョブが途中で失敗し、最初からではなくその特定のジョブからバッチを再開したい場合は、どうしますか?
回答: Datastageでは、ジョブシーケンスにオプションがあります– 「チェックポイントを追加して、失敗時にシーケンスを再開できるようにする」 。このオプションがチェックされている場合、失敗したポイントからジョブシーケンスを再実行できます。
Q#20)Datastageジョブをどのようにインポートおよびエクスポートしますか?
回答:F またはこれ、このためのコマンドライン関数の下
- インポート: dsimport.exe
- 書き出す: dsexport.exe
Q#21)Datastageのルーチンとは何ですか?さまざまなタイプのルーチンを参加させます。
回答:ルーチン DSマネージャーによって定義される一連の関数です。トランスステージを介して実行されます。
ルーチンには次の3種類があります。
- 並列ルーチン
- メインフレームルーチン
- サーバールーチン
Q#22)DataStageで重複する値を削除するにはどうすればよいですか?
回答: 重複する値を処理する方法は2つあります
- 重複の削除ステージを使用して、重複を排除できます。
- Sortステージを使用して、重複を削除できます。並べ替え段階には、「重複を許可する」というプロパティがあります。このプロパティをfalseに設定すると、並べ替えの出力で重複する値が取得されることはありません。
Q#23)Datastageディレクターで使用できるさまざまな種類のビューは何ですか?
回答: Datastageディレクターで使用できるビューは3種類あります。 彼らです:
- ログビュー
- ステータスビュー
- ジョブビュー
Q#24)InformaticaとDatastageを区別します。どちらを選びますか、そしてその理由は何ですか?
回答: InformaticaとDataStageはどちらも強力なETLツールです。
参加ポイントは、両方のツールを区別します。
コンピューティング | データステージ | |
---|---|---|
並列処理 | Informaticaは並列処理をサポートしていません。 | これとは対照的に、datastageは並列処理のメカニズムを提供します。 |
SCDの実装 | InformaticaでSCD(ゆっくりと変化する寸法)を実装するのは非常に簡単です。 | ただし、データステージにSCDを実装するのは複雑です。 Datastageは、カスタムスクリプトを介してのみSCDをサポートします。 |
バージョン管理 | Informaticaは、オブジェクトのチェックインとチェックアウトによるバージョン管理をサポートしています。 | ただし、datastageではこの機能を利用できません。 |
利用可能な変換 | より少ない変換が利用可能です。 | Datastageは、Informaticaよりも多様な変換を提供します。 |
ルックアップの力 | Informaticaは、非常に強力な動的キャッシュルックアップを提供します | datastageには同様のものはありません。 |
私の個人的な意見では、DatastageよりもInformaticaを使用します。その理由は、InformaticaがDataStageよりも体系的でユーザーフレンドリーであることがわかったためです。
もう1つの強力な理由は、Datastageと比較してInformaticaのデバッグとエラー処理がはるかに優れていることです。そのため、Informaticaでは問題の修正が容易になります。 Datastageは、完全なエラー処理サポートを提供していません。
=> Informaticaについてもっと知りたいですか?私たちは 詳細な説明はこちら。
Q#25)システム変数について考えてください。
回答: システム変数は、で始まる読み取り専用変数です。 ‘@’ これは、トランスステージまたはルーチンのいずれかで読み取ることができます。これらは、システム情報を取得するために使用されます。
Q#26)パッシブステージとアクティブステージの違いは何ですか?
回答: パッシブステージは抽出とロードに使用され、アクティブステージは変換に使用されます。
Q#27)Datastageで利用できるさまざまな種類のコンテナは何ですか?
回答: Datastageには2つ以下のコンテナがあります。
- ローカルコンテナ
- 共有コンテナ
Q#28)ステージング変数の値は一時的または永続的に保存されますか?
回答: 一時的に。これは一時変数です。
Q#29)Datastageのさまざまな種類のジョブは何ですか?
回答: Datastageには2種類のジョブがあります。
- サーバージョブ(順次実行されます)
- 並列ジョブ(並列で実行されます)
Q#30)Datastageディレクターの用途は何ですか?
mp3音楽ダウンロード無料トップアプリ
回答: Datastageディレクターを介して、ジョブのスケジュール、検証、実行、監視を行うことができます。
Q#31)ハッシュファイルの種類は何ですか?
回答: 2種類のハッシュファイルがあります。
- 静的ハッシュファイル
- 動的ハッシュファイル
Q#32)品質ステージとは何ですか?
回答: 品質段階(整合性段階とも呼ばれます)は、さまざまなソースからのデータを組み合わせるのに役立つ段階です。
結論
Datastageアーキテクチャとその主な機能に関する便利な知識を持ち、他の一般的なETLツールとの違いを説明できる必要があります。
さらに 、 Datastageジョブを作成して実行する方法をエンドツーエンドで、さまざまなステージとその使用法について公正なアイデアを持っている必要があります。
推奨読書=> ETLテストとは何ですか?
ではごきげんよう!
推奨読書
- ETLテストの面接の質問と回答
- ETLプロセスで役立つ10のベストデータマッピングツール(2021リスト)
- 2021年の15の最高のETLツール(完全に更新されたリスト)
- 例を含むデータウェアハウステストチュートリアル| ETLテストガイド
- ETLテストデータウェアハウステストチュートリアル(完全ガイド)
- ETLとDBのテスト-ETLテストの必要性、計画、およびETLツールの詳細
- InformaticaPowerCenterツールを使用してETLテストを実行する方法
- 例を使用して説明されたデータウェアハウス(ETL)のメタデータ
- プレスリリース-ETLテストおよびデータ移行テストプラットフォームのiCEDQSoft新バージョンリリース
- 2021年のトップ10ETLテストツール
- データウェアハウスのETL(抽出、変換、読み込み)プロセスとは何ですか?